سلسلة (مباحث لغوية) : 

يُصدر مركز الملك عبداللّه بن عبدالعزيز 
الدولي تخدمة اللفة الغربية هذه السلسلة 
ضمن خطة عمل مقسمة إلى مراحل: تشمل 
مرحلتها الأولى ثلاثين عنواناء لموضوعات 
علمية رأى المركز > بعد الدراسة - حاجة 
المكتبة اللغوية العربية إليها؛ أو إلى بدء النشاط 
البحثي فيها. ويهدف من وراء ذلك إلى تنشيط 
العمل © المجالات التي تُنَّه إليها هذه 
السلسلة. سواء أكان العمل علميا بحثياء أم 
عمليا تنفيذيا؛ ويد عو المركز الباحثين كافة من 
أنحاء العالم إلى المساهمة 4 هذه السلسة. 
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وتودٌ الأمانة العامة أن تشيد بجهد السادة 
المؤلفين؛ وجهد محرر الكتاب. على ما تفضلوا 
به من التزام علمي لا يستغرب من مثلهم. 
والشكر والتقدير الوافر لمعالي وزير التعليم 
المشرف العام على المركز, الذي يحث على كل 
ها :من شأئه كيت الهوية: اللغوية العربية: 
وتمتينهاء وفق رؤية استشرافية محققة 
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كلمة المركز 


يجتهد مركز الملك عبداللّه بن عبد العزيز الدولي لخدمة اللفة العربية 
العمل ف مجالات متعددة تحقق تعميق الوعي اللغوي على المستويات المختلفة 
(الاجتماعية والعلمية/ الأهلية والرسمية) ؛ وذلك للسمو باللغة العربية» وترسيخ 
منافستها للغات الحضارية # العالم» وتعميق قيادتها الدينية والتاريخية لشعوب 
شتى # أنحاء المعمورة. 


وافسن قا ةاتف يعهمك المركو ةمجان الفقر دتفهل ا الأعمال العلشية 
الجا قوق اكع سكين معطي ة ةكف كما تسيل تال التاليف ين قلذل 
استكتاب مجموعة كبيرة من الباحثين ؛ لتأليف عدد متنوع من الإصدارات النوعية 
المقروءة التي تعالج عنوانات يقتنصها المركز. ويلفت الانتباه إليها؛ ويعلن من 
خلالها الفرصى الممكنة لخدمة اللغة العربية #4 المجالات المختلفة امنيا الاك 
الحاجات التي يلمس المركز تطلع المكتبة اللغوية العربية إليهاء ولافتاً الأنظار إلى 
أهميكة الغرية ضهنا بحضاء واستعفاه ينا ينكق عملة سفيني] لهذم العالاته, 
ويسعد المركز بأن استقطب # المرحلة الأولى من هذا المشروع ما يربو على متي 
بالحاعه وشا درقدرة المشاوعة تعليا وظرحيا زعرها اناميا وهاكيا: دوعا 
مسارات البحث الرئيسية والفرعية؛ ومنفتحا على كل ما من شأنه خدمة اللغة 
العربية بجميع الوسائل والأطر. 

وتمشل هنن! الككات واخدامخ الكذب التي مند رت طتمن سلبلتة (مباحة 
لغوية) يحتوي عددا من الأبحات لأساتذة مرموقين؛ استجابوا لما رآه المركز من 
الحاجة إلى التأليف تحت هذا العنوان: وبادروا إلى ذلك مشكورين. 


وتودٌ الأمانة العامة أن تشيد بجهد السادة المؤلفين: وجهد محرر الكتاب»: 
ومدير هذا المشروع العلمي على ما تفضلوا به من التزام علمي لا يستغرب من 
مثلهم. وقد ترك المركز للمحرر مساحة واسعة من الحرية 4# اختيار الباحثين 
ووضسع البخطة المابية > بالشف اوومع الركز > سعي ا إلى تخفيق أقصى ها يمكن 
تحقيقه من الإفادة العلمية؛ مع الأخذ بالاعتبار أن الآراء الواردة 4# البحوث لا تمثل 
رأي المركز بالضرورة: ولكنها من جملة الآراء العلمية التي يسعد المركز بإتاحتها 
للمجتمع العلمي وللمعنيين بالشأن اللفوي لتداول الرأي . وتعميق النظرء ونلفت 
انتباه القارئ الكريم إلى أن ترتيب أسماء المؤلفين على الفلاف موافق لترتيب 
أبحاثهم 4 الكتاب. وهي خاضعة للرؤية المنهجية التي تفضل المحرر - مشكورا- 
باقتراح خطتها. 


والشكر والتقدير الوافر لمعالي وزير التعليم المشرف العام على المركز, 
الذي يحث على كل ما من شأنه تثبيت الهوية اللفوية العربية؛ وتمتينهاء وفق رؤية 
ستشرافية محققة لتوجيهات قيادتنا الحكيمة: ويمتد الشكر لمعالي نائبه» وللسادة 
أعضاء مجلس الأمناء نظير الدعم والتسديد لأعمال المركز. 

والدعوة موجهة لجميع المختصين والمهتمين بتكثيف الجهود نحو النهوض 
بلغتنا العربية, وتحقيق وجودها السامي 2 مجالات الحياة. 
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المقدمة 


إنّ الحمد للّه. نحمده. ونستعينه» ونستغفرهء ونعوذ باللّه من شرور أنفسناء 
ومن سيئات أعمالناء من يهده الله فلا مضل له؛ ومن يضلل فلا هادي له؛ وأشهد 
ألا إثة الا اللمجوهده لاشريك له وأشيك أن مهدا عيذ ورسيولة أمنا بعد 


فقد أيد الله -تبارك وتعالى- رسله بآيات: ثم اصطفى لخاتمهم منها كلامه 
الفريى] يكافنة اننيو تعكاك مدن عن النيان زالككمن هلم الشوا علق 
الإنسَانَ . عَلَمَهُ الْبَيَانَ) وكانت (بلسّان عَرَبيّ مُبين). و هذا ما يكفي للإشارة إلى 
فضل البيان عموما واللسان العربي تخصوما. 


ولعلوم الحاسب فضلها المستمد من كون الحاسب آلة تمد وتقوي ما ميز اللّه 
به بني آدم من عقل؛ كما أن المقراب امتداد لقوة الإبصار. لذاء فيمكننا القول بأن 
نسبة رقي الحاسبات على غيرها من الآلات كنسبة رقي العقل على الجسد. ثم إن 
برمجة هذه الآلات - التي ابتدأت ببعض أعمال الإخوة بني موسى- تحتاج إلى لغات 
خاصة بهاء مما يعود عليها بما أسلفنا من فضل البيان واللسان. 


يتناول كتابنا هذا الحاسب 4# خدمة اللغة العربية. وهو هيكله يشبه 
الشجرة: إذ يبدا بثلاثة بحوث #4 البنى التحتية: أحدها يناقش الأساس التقليدي 
لبرامج حوسبة اللغة؛ وهو تمثيل اللغة العربية 4 الحاسوب. والآخران للمدونات 
اللفويعة وقواع و البن] نانع يفت هيا النظلع ا تماد ة قم فسن إلى يا نامي 
الجذع -وهي الأدوات التي تحمل غيرها من التطبيقات المثمرة- فجاء ببحثين 
استقصى أحدهما التقنيات التقليدية والإحصائية لمعالجة اللفات الطبيعية 


5 9 و 
وتخصصىر الاخر آش طريقة لتعلم التشكيل اليا. ثم ختم الكتاب بفرعين مثمرين 


استقصيا تطبيقات الترجمة الآلية من العربية وإليها وتطبيقات التعرف الآلى على 
قراءة القرآن الكريم. 

وكان حرصنا منصبا 4# هذا الكتاب العربى على المقدمات الاستقصائية لأنه 
باكورة 4 سلسلة؛ فناسبه التمهيد لما بعده. كما حرصنا أن يكتب موضوعاته نخبة 
من أساتنة الجامعات ومدراء الشركات المتخصصة #4 المملكة العربية السعودية 
والمملكة الأردنية الهاشمية والمملكة المتحدة والولايات المتحدة الأمريكية. وإننا 
لنرجوأن تستمر هذه السلسلة المباركة وأن يّفيد من هذا الكتاب وما بعده باحثو 
اللسانيات وباحثو الحاسوب وغيرهم. واللّه ولي ذلك والمبارك فيه. 


المحرر: 
د.يوسف بن سالم العريان 
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حول نظام تمثيل الحرف العربي 


أ مأمون صبحي الحطاب © 
1.1266 


دار حوسبة النص العربي 
باحث 4 حوسبة اللغة العربية» قام بتطوير عدد من الأنظمة المحوسبة 4 مجالات: الصرف 
والنحو ومحركات البحث العربية» وتطويع التقنية لخدمة ذوي الاحتياجات الخاصة العرب. 


وهو عضو مؤسس لجمعية حوسية اللغة العربية وإثراء المحتوى العربي على شبكة الإنترنت. 
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.١‏ المقدمة 
مرحلة المعالجة, تتبعهما مرحلة إخراج النتائج. ولم تحقق برامج التحليل اللفوي 
قوط المع خص نض نظله تمرل العرينة يعن قا كلها جك شياف إننا وني 

يتلم شرل القةالاتعزر ويه موسي النيةإلمالية الحالئة: 

لقد أدت اللغة العربية دورا بارزا 4 نقل الحضارة الإنسانية واستيعابها لعدة 
قرون دونما انقطاع. ويعبر عن هذا الدور الحضاري مؤسس علم اللغة الحديث 
إدوارد سابير 11م52 2053310 خ19: ,157١‏ حيث يقول: 


"إن تلماه اتخكى الف كان لما دون ركس عة حمل البخطنا زه والاتباتنة هسن: 
الصينية القديمة والسنسيكريتية والعربية واليونانية واللاتينية". 


والملاحظ أن اللغة العربية هي الوحيدة من بين هذه اللغات الخمس التي ما 
زالت تؤدي دورها دون انقطاع. وقد شهد للعربية بآنها لغة علمية- العالم اللغوي 
رونالد لانفيكر 1عاء1.2283 11023210 (1377:1487) الذي يرى أن طبيعة الكلمات 
المستعارة من لغة ما تعكس مدى تأثيرها 4# اللغة المستعيرة:؛ وأن نسبة كبيرة من 
الكلمات العربية الداخلة # الإنجليزية هي كلمات علمية مثل 2610 و10161023لى و 
8 وغيرها كثير. وهي كلمات دخلت الإنجليزية عن طريق الإسبانية. ويذكر 
أن الدكتور وجيه حمد عبد الرحمن قد أثبت وجود ٠٠٠١‏ جذر عربي 4# معجم 


أوكسفورد الإنجليزي .)١(‏ 


١١ 


أما المستشرقة الألمانية ريجارد هونيكه فتقول 2# كتابها الشهير شمس العرب 
تسطع على الغرب" (1977:747) : إنه قبل ستمئة عام كان لكلية الطب الباريسية 
أصغر مكتبة # العالم؛ لا تحتوي إلا على مؤلف واحدء لعربي عظيم . وكان هذا 
الأثر العظيم هو المرجع الأساسيلمدة تزيد عن أربعمئة عام بعد ذلك التاريخ دون 
أن يزاحمه مزاحم, أو تؤثر فيه أو + مكانته مخطوطة من المخطوطات الهزيلة التي 
دأب.# صياغتها كهنة الأديرة قاطبة. وهذا العمل الجبار خطته يد الرازي (أبو 
بكر محمد بن زكريا). وقد اعترف الباريسيون بقيمة هذا الكنز العظيم وبفضل 
صاحبه عليهم وعلى الطب إجمالا فأقاموا له نصبا 4# باحة القاعة الكبيرة ب 
مدرسة الطب لديهم» وعلقوا صورته 4# شارع سان جيرمان. 
بالرغم مما تقدم من حقائق علمية ثابتة فقد تعرضت اللغة العربية لحملات 
مغرضة تفتقر إلى الموضوعية وتتناقض مع حقائق علم اللغة الحديث. وقد انصب 
الهجوم على عدة محاور منها: 
.١‏ الادعاء بعدم صلاحية الخط العربي والدعوة لتلتينه. 
؟. الادعاء بأن العربية لغة دينية - بالمفهوم الكهنوتي للدين - وليست لغة 
*. الادعاء بجمود العربية الفصحى وضرورة السماح بالتغيير اللفوي المتمثل 
4 العاميات والدعوة لإحلالها محل الفصحى. 
4. القول بافتقار العربية للعدد الكال من اللواصق (السوابق واللواحق) 
لترجمة ما يعادلها 2 اللغات الأوروبية الحديثة التي تنقل العربية عنها 
القرن العشرين. 
؟. تاريخ تطور نظام كتابة العربية 
عرفت العرب الكتابة 4# جاهليتها -قبل الإسلام- واعتبرتها شرطا 4 كمال 
الرجل العربي» وتعود معرفتهم بالكتابة إلى اتصالهم بالأمم المتحضرة # بلاد 


١1 
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اليمن وتخوم الشام؛ فأنشأ الأنباط -مثلا- ممالكهم على أطراف بلاد الشام ب 
الناحية الشمالية الغربية من شبه الجزيرة العربية (79١ق3‏ م -57١٠م)‏ .واتخذت 
البتراء "سلع" عاصمة لهاء وكانت لهم صلات بالأراميين. فتأثروا بهم وتحدثوا 
لغتهم واستنبطوا لأنفسهم خطا خاصا بهم عرف بالخط النبطي؛ اشتق منه عرب 
الشمال الخط الأنباري والخط الحيريء أو الخط المدور والخط المثلث. 


ونجد عند العودة إلى تاريخ الكتابة العربية أنها مرت بثلاث مراحل )١(‏ هي: 
مرحلة النشأة التي تمتد حتى ظهور الإسلام؛ ومرحلة الاستخدام الواسع وتمتد 
حتى بعيد منتصف القرن الثاني الهجري ثم مرحلة تقعيد الإملاء. 

فقد شجع الإسلام على تعلم الكتابة؛ وسلك ‏ ذلك وسائل مختلفة؛ حتى 
أن رسول الله صلى الله عليه وسلم اشترط لفكاك الأسير من قريش 2# بدر تعليم 
عشرة من صبيان المدينة الكتابة» فراجت الكتابة ب عصره صلى الله عليه وسلم 
حتى بلغ عدد كتاب الوحي أكثر من أربعين كاتبا. 

وتعد الحجاز أول بلاد العرب معرفة للكتابة؛ وكانت قريش # مكة؛ وثقيف 2 
الطائف أكثر القبائل شهرة بهاء ومن أبنائها اختير كتاب صحف أبي بكر الصديق 
رضي الله عنه؛ وكان عمر بن الخطاب رضي الله عنه يقول كما روى جابر بن 
سمرة: لا يملين ‏ مصاحفنا هذه إلا غلمان ثقيف. وعندما جمع عثمان بن عفان 
رضي الله عنه مصاحفه قال: اجعلوا المملي من هذيلء والكاتب من ثقيف. (؟) 


ثم أتت مرحلة التقعيد؛ وهي المرحلة التي تآثرت بالقواعد الصرفية والنحوية, 
مما جعل الاملاء العربي. ب مواضع كثيرة؛ يشير إلى قواعد النحويين أكثر مما 
يصف واقعا كتابيا ملموسا. (؟) حتى رأى بعض الباحثين المعاصرين (5) أن اللغة 
العربية مكونة من ثلاثة أنظمة: هي: النظام الصوتي والنظام الصر والنظام 
النحويء وقائمة من الكلمات التي لا تنتظم 4# جهاز واحد. وأن هذه الأنظمة تكون 


١ 


معينا صامتاء فإذا أردنا أن نتكلم أو أن نكتب؛ نظرنا 4 هذا المعين الصامت 
فوضعنا محتوياته 4# حالة عمل وحركة؛ فأخذنا منه الكلمات ورصفناها على 
شروط الأنظمة؛ أي بحسب قواعد اللغة. 


كان الاملائتيون العرب أنفسهم نحويين وصرفيين. لذلك لم يفصلوا -عند 
وضعهم لقواعد الاملاء- الكتابة عن اللغة؛ ولم يفصلوا قواعد الاملاء عن قواعد 
اللغة:؛ بل إنهم أقحموا قواعد اللغة # الكتابة والاملاء: مما جعل الاملاء العربي 
مواضع كشيرة- يشير إلى قواعد النحويين أكثر مما يصف واقعا كتابيا 
ملموسا. (5) 
". تمثيل الكتابة لصوت الكلمة 

حاول الرسم الكتابي منذ نشأته أن يجاري المنطوق # وظيفته وأن يكون 
مطابقا لأصوات الكلام؛ فتطور 4 سبيل ذلك من الصوري إلى المقطعي ثم إلى 
الأبجديء واتخذ رموزًا مميزة للحروف والحركات. وابتدع علامات خاصة لتمثيل 
الظواهر الصوتية الأخرى وتقريب المكتوب من المنطوق. ومما ابتدعته العربية بخ 
هذا الشأن الشدة والمدة وعلامات الحركات والسكون والنقط الذي يختلف عددًا 
ومكانًا وأدخل - لما شاع اللحن إثر دخول غير العرب 2# الإسلام- على الكتابة 
العربية ما يطورها مثل: 

أ. النقط 

وتجمع معظم المصادر على أن أول من أدخل النقط هوع الم اللغة المشهور 
أبو الأسود الدؤلي (تو عام /14م) وذلك لما لوحظ من لحن # تلاوة كتاب اللّه 
العزيز. 

ب. الإعجام 


ويعرّف ابن جني الإعجام بأنه إزالة العجمة. وهو مشتق من "أعجم" أي أزال 


1١: 
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ت. الشكل 

وأول من أدخل الحركات القصيرة الضمة والفتحة والكسرة هو الخليل بن 
أحمد الفراهيدي (المتوِك عام 87/م) . كما أدخل السكون (”) الذي يعني غياب 
الحركة. 

وبإدخال هذه الاصلاحات الضرورية على نظام كتابة العربية أصبح ذلك 
00 2 ب ما يكون إلى و الكتابة الصوتي أعاوتاجات عتأعصمطط) الذي 

أولا : التناظر بين الحروف الصائتة ثتة والأصوات الصائتة (ويلا حظ هنا أن كل 
حرف يمثل صوتا واحدا لا غير والعكس صحيح): 


لل 
الاك" اك كك 7 لكك اك كر 
م 
سس ل الاك الك لخ 
تمك د كبك ترات جات كك 
الس لكر ال 


#عفنت | أساس ‏ | #6 | /س | 
كح كن كك ككس 2 
٠".‏ 15 لمحت كك ال ل ان 2 كل 
١‏ #«نة | ضيب | 18 | لض | 
٠ ٠١‏ 9 2 كك بك كك رك كك 


لسلست ا | _ظلم ‏ | 2/ | لظ 
السك الاك و الات الاك لكا 


ا اا ا ا 


// 


/7531122/ 


و ا > ا اك اك 
لط | كت | #4 | 2ل 


وهكذا يتضح أن درجة كفاءة الكتابة العربية تضاهي أحدث وأدق ما توصل 
إليه علماء اللفة والأصوات 2# الأوساط الغربية ألا وهو "نظام الكتابة الصوتية" 
الذي وضع للتغلب على الصعوبات المستعصية التي تواجهها أنظمة الكتابة لمعظم 
اللغات الحديثة التي تعرصت لحدوث بون شاسع بين نظامي الكتابة والنطق. 
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+ المقابل نجد اللغة الإنجليزية أبعد كثيرا عن نظام الكتابة الأمثل وذلك 
للأسباب الآتية: 
-١‏ تمثيل بعض الحروف لأكثر من صوت. ففي اللغة الإنجليزية -وهي اللغة 
العالمية الأولى 4 عالمنا المعاصر- نجد ما يأتى: 
أن “ره ادرف 87" إلى الأميواك الكالنس أ مها :ا بع نان يق 11 


11 كما 4 الكلمات 196 ٠‏ 6211 , #عطاة1 ؛ 711138 و 036531) على التوالي. 


بيرم اعرف "8" إن أقا أقا ءاحنا خاقا الناها 
كما 4 الكلمات 0385 ؛ 0315 : 015565 , 1نا226335 ؛ عتتاووع01 و 151320 على التوالي. 

وينطبق هذا على كثير من الصوامت والصوائت الإنجليزية. 
4 الإنجليزية يمثل على النحو التالي وبالحروف التالية : 

©6©, 8© , أع ,. © , سشلإع , © , 0© ,غ2 

وذلك كما 4 الكلمات عع؟ » هوعا » عتكلععع] » لعتلطا » لاععا , وعواك0 ؛ ع1[ممعم » 
:601 على التوالي. 

1 توجد حروف صامتة 4 معظم الكلمات وهوما يضاعف صعوية القراءة 
والكتابة.# الإنجليزية للناطقين بها من ابنائتها وغيرهم. وفيما يلي أمثلة على 
ذلك: 


1١/ 


ل ام ...ا 


وقد نجم عن هذه العوامل وأمثالها بون شاسع بين نظامي الكتابة والنطق ب 
لغة العلم والحضارة # يومنا هذا مما حدا بالبرلمان البريطاني لطرح هذه المسالة 
المؤرقة على بساط البحث لإعادة التوازن بين النظامين. 


إن الذي أدى إلى حدوث مثل هذا الخلل الجسيم 2# النظام اللغوي الإنجليزي 
هوتغير النطق دون أن يواكبه تغير . نظام الكتابة. حتى إن الكاتب الإيرلندي 
الشهير جورج برناردشو 51327 8611310 060186 يوضح حجم المفارقة إذ يقول 
او كل اوتا حمق أن نطق "اف" إرة انيمطها عن حروف الأوتن نالا صبوات 
الملأخوذةمن الكلمات أدناه: 
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اكتهلاا 1 -طعناد[ 
امتصتا 1 -معممسىى 
اموماعمها [ -ممقهم 


اللغة العربية» ومع ذلك فإن التقدم 4# نظم معالجة اللغة الإنجليزية بالحاسوب لم 


؟. بعض مشاكل تمثيل الكتابة العربية 

كان الإملائتيون العرب أنفسهم نحويين وصرفيين -كما ذكرنا سابقا- فلم 
يفصلواء عند وضعهم لقواعد الاملاءء الكتابة عن اللفة؛ ولم يفصلوا قواعد 
الاملاء عن قواعد اللغة, بل أقحموا قواعد اللغة # الكتابة والاملاء: مما جعل 
الاملاء العربي؛ ب مواضع كثيرة؛ يشير إلى قواعد النحويين أكثر مما يصف واقعا 
كتابيا ملموسا. (4) وجاء هذا التقعيد على حساب دقة التمثيل الصوتي للمنطوق 
وأدى إلى قصور فيه كما جعل قواعد الإملاء عرضة لاختلاف وجهات نظر العلماء 
تبعا لاختلاف وجهات نظرهم 4# الصرف والتنحو. 

ولم يكن واقع التطبيق بهذه المعيارية الصارمة؛ فاعترى الرسم الكتابي العربي 
مشكلات متعددة: وأخطاء شائعة عند الاستعمال. فمن المشكلات البارزة غياب 
الحركات وعدم اندغامها أ بنية الكلمة العربية المكتوبة. وهي تزود من الذاكرة 
وكاو هتى | تحتبوع اللفوية اكه الدسرةوعلن السؤاق اللسوف الذي يجين 
المعنى. وتلّقَط الكلمة ‏ النصوص غير المشكولة كما تفهم من السياق وكما يحددها 
الحس اللفغوي مما يصعب للحاسوب معها. 

إن النظام الكتابي الحالي للفة العربية هو نظام صامتي 00017501212181 


عمومًا لا يعترف إلا بالحروف الصحيحة وحروف المد واللين: ولا يعترف بالحركات 
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حروفًا. فكل ما ليس له رمز الألفباء العربية لا يعد حرمًاء على الرغم من قول 
علماء العربية (؟) إن الحركات أبعاض حروف المد واللين؛ وهي تماثلها من حيث 
النوع ولكن تختلف عنها من حيث الكم. وإدراكهم قيمة الحركات # التمييز بين 
الألفاظ المعجمية والصيغ الصرفية والحالات الإعرابية. 


وقد استعيض عن دمجها # بنية الكلمة المكتوبة بوضع علامات لها -]1013011 
16 تكتب خارج الكلمة قوق الحروف أوتحتها. 


ومن المشكلات رسم الهمزة الذي يختلف حسب موضعها من الكلمة ( أي 
مجيتها أولا أووسطًا أو آخرًا) وحركة ما قبلها أوسكونه. وحركتها هي أو سكونها. 
ويتصدل بهذا الجاتب الشاين همتزة القطع تيؤة الوصدل الت يوقى يها توت اذ 
إلى النطق بالساكن # أول المجموعة الكلامية 170658266 وهي تختفي إذا سبق 
الساكن بحركةك# درج اكلام ومع ذلك تقال نظ مرسده] فرذلك الوم 
تنبيمًا على أن هذا الموضع هو مما يستوجب إدخال الهمزة عندما لا تكون هناك 
حركة. وواضح ما تدخله همزة الوصل من تغيير 4 النمط المقطعي للكلمة. 

ومن المشكلات كذلك كتابة الألف 4# نهاية الكلمات من أفعال وأسماء قائمة 
أوغير قائمة (أي مقصورة 2# الاصطلاح الشائع): والتفريق بين هاء الضمير 
(كماك له وعنده) والتاء المربوطة ( كما ب طالبة) إذ يحدث اللبس فيهما عندما 
لا توضع نقطتان للتاء المربوطة. وكذلك التفريق بين التاء المربوطة التي يوقف 
عليها بالهاء (مثل فاطمة) والتاء المفتوحة التي يوقف عليها بالتاء (كما يقالت 
وأوقات) . 


وقد يعد من المشكلات وصل الحروف بعضها ببعض. لأنه يجعل من الكلمة 
وحدة إملائية لا وحدة معجمية أوصرفية بحتة؛ ويصعب تحليل كلمات مثل 


(سألتكه) إلى عناصرها الأولى من صرفية ومعجمية. 
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ومن المشكلات أن الواو تمثل حرفين هما واو المد وواو اللين: وأن الياء تمثل 
حرفين كذلك هما ياء المد وياء اللين» مع أن اللين ذو طبيعة صامتة والمد ذو طبيعة 
صائتة. (7) 


ومن المشكلات زيادة حروف لا تنطق؛ كزيادة ألف بعد واو الجماعة التي يُسند 
الفعل الماضي والمضارع المجزوم أو المنصوب إليها (دَعوًَاء لم يَدَعُواء لن تدعوا) . 
وربما كانت هذه الزيادة ذات فائدة # التمييز بين واو الجماعة التي أسند إليها 
الفعل والواو الأصلية التي ينتهي بها الفعل الناقص غير المسند مثل يدعو ويرجو. 
إلا أنه صار من الأخطاء الشائعة إدخال هذه الألف بعد واو الفعل غير المسند 
(يدعو)؛ وبعد جمع المذكر السالم المرفوع المضاف ( مهندسوا المشروع) . 

وعكس ذلك نقص بعض الحروف كنقص الألف 3# أسماء الإشارة (مثل هذا 
وهذه). وقد أصبحت هذه الكلمات وأشباهها بحكم الشيوع والإلف يونا شا كاذ 
لا يشير ئ نفس العربي أية مشكلة. خلا بعض الصعوبات 2# مراحل التعليم الأولى. 
وريما كانت هذه الكلمات وأضرابها مشكلة لدى المتعلمين من الأجانب. وكاختفاء 
لام التعريف -نطقا- قبل الحروف الشمسية ووهو من قبيل الإدغاه”7”. 

ومن الأخطاء الشائعة وضع ياء بعد ضمير المخاطبة (قرأتي. لكي)؛ والخطأ 
كتابة "ابن" بين علمين؛ والطريقة التي تكتب بها بعض الألفاظ مثل منّة بالألف. 
و"داوود" و" طاوومس" بواوواحدة, والتي والذي واللذين بلامين فتلتبس بلفظي 
المثنى اللذين واللتين. 

والخطأً ي كتابة الاسم المنقوصصء ومسائل الفصل والوصل # أمثال: لثّن» 
ولتلا وطالما وانما وثلا ثمئة. 


00 ينظرك# مشكلات الرسم والأخطاء الشائعة الكتب الآتية: الإملاء العربي لأحمد 
قبشء والإملاء والترقيم 4 الكتابة العربية لعبد العليم إبراهيم ؛ وقواعد الإملاء لعبد 
السلام هارون 


"5 


ويمكن التفريق بين الواو المدية والواو اللينة؛ والياء المدية» والياء اللينة. بوضع 
ضمة قبل واو المد, وكسرة قبل ياء المد. كما فعل القدماء. 


إن المشكلات السابقة ليست بالمستعصية:؛ ويمكن للبرامج الحاسوبية أن تقوم 
بمعالجة كثير منهاء وقد أحرز نجاح لا يستهان به © هذا المجال. وبقي بعضها عقبة 
أمام برامج التحليل اللغوي. 

كما يجدر التنبه هنا إلى أن علامات الترقيم تساعد كالضبط تمامًا على 
الفهم السليم للنصوصء إذا ما أحسن استخدامها عند حدود المعاني الجزئية 
وحدود المعاني الكلية. وهي علامات مهمة 4 تحليل النصوص حاسوييًا. 


ه. الخلاصهة 

لا تواجه جهود لسانيي الحاسوب العرب تحديات كبرى تعود إلى عدم كفاءة 
نظام كتابة العربية 4 تمثيل صوت الكلمة العربية أوصرفها. ومع ذلك قصرت 
جهودهم عن تطوير نظم التحليل اللغوي التي تضاهي النظم التي طورت للغة 
الإنجليزية. ولما تظهر حتى الآن تطبيقات الذكاء الاصطناعي العربية 4# الفهم 
الآلي التي يمكن توظيفها 2# تطبيقات الترجمة الآلية والبحث عن النصوص 
والتعهرف على الحروفء وغيرها من التطبيقات. إن هذه النتيجة تدعو الى دراسة 


5. المراجع 
طعل؟ 01 22177مء01 عواعطم لكل (1991) .11 ممستطدئعلطم .1 
-م2 الاعص2 كل عتطوعك - امتاعصظ - صتاه[ - مععة0 :10015 عطقنا 
]05 وأء6م257 ©5012 01 56107 عط مغ طعدمم 
1 نال ع1نتهة1ط1آ 
”. غانم قدوري الحمدء "علم الكتابة العربية'. دار عمارء عمَّانَ ,5٠١4‏ 
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فهد لطباعة المصحف الشريف. المديئة المنورة . ١47١اه-٠‏ ٠5م‏ 


محمد أحمد أبوعيد. مجلة دراسات 4# اللغة العربية وآدابها. فصلية 
ع العدد السادس عشرء شتاء / 4١١5م.‏ 


تمام حسانء "اللفة العربية معناها ومبناها"'. عام الكتبء القاهرة, 


4ص 10. 


.١ ص7‎ 1١ج‎ ١5/76 دمشق:2:‎ 


كمال بشرء علم الأصوات, دار غريب» القاهرة. الايد ١٠م‏ ص 14 .١‏ 
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أبحاث جامعة ليدزظ مجال لسانيات المدونات العربية 


د. إايريك أتويل (4157©11/ 1112[ ) ه 


عآنا.ع11)6166015.2ء 417 .ك. ]1 


أ عبدالله بن يحيى الفيفي”” 
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أستاذ مشارك 4# قسم الحاسب الآلي 4 جامعة ليدز ببريطانيا. 
متخصص ذش معالجة اللغة طبيعية» ومهتم بمجال التنقيب 4# النصوص وتحليل البيانات» وله 
اهتمام كذلك باللغة العربية» وقد أجرى العديد من الأبحاث حول هذه الموضوعات؛ كما أشرف 


على مجموعة من طلاب الدكتوراه الذين أسهموا 4 بحث هذه الموضوعات. 


) معهد تعليم اللغة العربية» جامعة الإمام محمد بن سعود الإسلامية الرياض. 


متخصص + معالجة اللغة الطبيعية؛ شارك عدد من المشاريع العلمية 2 مجال معالجة 
اللغةالعربية حاسوبيًاء له عدة أبحاث منشورة حول مدونات المتعلمين: إضافة إلى مشاركته 
4 تحكيم عدد من الأبحاث العلمية. أنشأالمدونة اللغوية لمتعلمي اللغة العربية (.117117117 
.21010115 2 إضافة إلى بع التطبيقات الحاسوبية ب مجال 


المدونات اللغوية, مهتم بعلم اللغة الحاسوبي» وتعليم اللغة بمساعدة الحاسب. 
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الملخص 


طور الباحثون 4# مجال لسانيات المدونة ومعالجة اللغة الطبيعية 4 بريطانيا 
الكثير من المدونات اللغوية والأدوات الحاسوبية للبحث 2 اللغة الإنجليزية. و 
جامعة ليدز729, أردنا أن تمتد هذه الأبحاث لتشمل اللغة العربية أيضًا؛ ولأن هذا 
يتطلب بناء مدونات لغوية عربية فقد أنشأنا عدة مدونات منها: مدونة تعليم 
العربية بواسطة الحاسب الآلي, والمدونة اللغوية للعربية المعاصرة؛ ومدونة الإنترنت 
العربية؛ ومدونة اللغة العربية حول العالم, والمدونة اللفوية لتدريس معلومات عن 
الإسلام؛ والبنك الشجري للخطاب العربيء والمدونة اللغوية لمتعلمي اللغة العربية, 
والمدونة العربية لنصوص القرآن الكريم؛ ومدونة الإحالة الثنائية لضمائر القرآن 
الكريم؛ ومدونة الترابط الدلالي بين آيات القرآن الكريم, ومدونة القرآن الكريم 
الموسومة بموضوع الآيات مع الترجمة الإنجليزية: ومدونة جامعة الملك سعود للغة 
العربية الفصحى. كذلك طورنا مجموعة من الأدوات لتحليل النصوص العربية, 
منها: الكشاف السياقي 200520001506 للغة العربية؛ والمحلل الصرك 5411/14 
لوسم أقسام الكلام 4 المدونات العربية» وجدول وسم الأخطاء # مدونات المتعلمين 
العربية: والوسم الصوتي والمقطعي للفة العربية» وتدريب برامج التخاطب الآلي 
على مدونة عربية؛ والوسم الدلالي والتمثيل المعر للقرآن الكريم. وقد استّخدمت 
هذه المدونات اللغوية والأدوات الحاسوبية لإجراء العديد من الأبحاث .4# مجال 


1 جامعة ليدز هي أقدم وأكبر جامعة ‏ مقاطمة ©1نط201165آ خ إنجلترا. افتّتحت الجامعة عام 
54 ؛ ويعمل فيها حاليًا ما يربوعلى سبعة آلاف أكاديمي وموظف. كما يدرس فيها أكثر من اثنين 
وثلاثين ألف طالب من ١55‏ دولة. تتميز الجامعة كذلك بأبحاثها الواسعة 4# عدد من الموضوعات 
الحنوية: كالمتديسية: والقلب؟واللقةوعيرها يمد مركن" اللمة دف جا معة ليندز ::واحد اشن أكيق 
المراكز البريطانية التي تقدم أبحاثا ومنحا يذ الجوانب المتعلقة بدراسة اللغة, وينتمي لهذا المركز 
أكثر من مئة باحث خ العلوم الإنسانية؛ والآداب؛ والتربية: والعلوم الاجتماعية والنفسية؛ وعلوم 
الأحياء: والخاب الألى» والهتدسة. 


”/ 


لسانيات المدونات العربية» ومن ذلك على سبيل المثال تعليم اللغة العربية» والمقارنة 
بين اللغتين الإنجليزية والعربية. ويعد موقع المدونة العربية لنصوص القرآن الكريم 
أحد أبرز الأمثلة على هذه الأبحاث. حيث يُستخدم على نطاق واسع من قبل 
الباحثين # اللفويات العربية. وكذلك علماء الشريعة الإسلامية؛ وعامة الناس © 
البلدان الإسلامية وغيرها من البلدان حول العالم. وقد قادتنا هذه الأبحاث إلى 
اقتراح موضوع "فهم النصوص الدينية" باعتباره أحد التحديات الجديدة والهامة 
4 مجال البحث 2# لسانيات المدونات اللغوية. 


ةهمدقملا-١‎ 

يمكن تعريف المدونة اللغوية (0010115) بأنها مجموعة من النصوص اللغوية 
-أو الأحاديث الشفهية- الطبيعية؛ التي تجمع لأغراض محددة؛ وتحفظ بطريقة 
قابلة للقراءة والبحث حاسوييًا (-نال 19925 بطعوع.آ :2006 ,.1ه اه تتتعمطء]/1 
طنانة ]1 لله 1315157: 3٠١4‏ ). وتتعدد التسميات العربية للفظة 001115: لكن 
تسميتها 'مدونة لغوية" قد تكون الأكثر شيوكًا حسبما يرى محمود إسماعيل 
صالح ( العصيميء قيد النشر)؛ وكذلك وردت 4# مجموعة من معاجم ترجمة 
المصطلحات اللغوية والحاسوبية (انظر مشلا البعلبكي, 1738:196٠‏ والمبارك, 
06 17. والزهيريء :7٠١7‏ 510؟: والفهري. :5٠١5‏ 114). 

لم تعد خافية على الباحثين اللغويين تلك الأهمية التي بات يحظى بها الجانب 
الحاسوبي # الدراسات اللغوية؛ فمثلا يرى 5157دع1>11 )7٠١07(‏ أن أدوات معالجة 
اللغة الطبيعية وكذلك اللغويات الحاسوبية قد دخلت إلى مجالات البحث اللغوي 
كالمتنمر كي باحة المدرسة؛ مما جعل كل ما هو غير حاسوبي إما خاضعًا لهاء أو 
متواطنًا معهاء أو مُهِمّشًا. وقد أدرك الباحثون .4 جامعة ليدز هذه الأهمية؛ فطوّروا 
أدوات حاسوبية ومصادر لغوية بداية باللغة الإنجليزية؛ ثم توسعوا # هذه الآدوات 
والمصادر لتشمل عددًا من اللغات ومنها اللغة العربية. وفيما يتعلق بلسانيات 
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المدونات العربية فثمة عدة وحدات بحثية 4# الجامعة تشترك جميمًا 4 العمل 
على هذا المجال؛ ومنها قسم الحاسب الآلي. وقسم اللغات والثقافات والمجتمعات, 
وقسم الدراسات العربية والإسلامية والشرق أوسطية؛ ومركز دراسات الترجمة: 
وقسم اللغويات والصوتيات: ومعهد الذكاء الاصطناعي والأنظمة الحيوية. وتتبنى 
هذ الأقسام يْ جامعة ليدز عددًا من المشاريع البحثية ب مجالات رئيسة مثل: 
بناء المدونات العربية» وتطوير أدوات تحليل النصوص العربية:؛ إضافة إلى إجراء 
الدراسات العلمية 4 مجال لسانيات المدونات العربية. 


نسرد ذخ الفصل الثاني من هذا البحث تبنًا بأهم المدونات اللغوية العربية 
التي أنشئت 4# جامعة ليدز. ثم نخصص الفصل الثالث لاستعراض مجموعة من 
الأدوات الحاسوبية المصممة لتحليل النصوص العربية؛ وي الفصل الرابع نتحدث 
عن أبرز الموضوعات البحثية التي استفادت من هذه المدونات اللغوية والأدوات 
الحاسوبية؛ ثم نختم بأهم مجالات البحث اللغوي التي نسعى لدراستها مستقبلا. 


"-المدونات اللغوية العربية 

أنشئت 4 جامعة ليدز مجموعة من المدونات اللغوية العربية لتكون مصدرًا 
مساعدًا لإجراء الدراسات على اللغة العربية» ونسرد فيما يلي هذه المدونات مع 
إيراد أمثلة للأبحاث التى استفادت من كل واحدة منها. 


مدونة تعليم العربية بواسطة الحاسب الآلي (1161ام0012 '[8 وأطورك :480 ) 

بدأت مشاركة جامعة ليدزك أبحاث لسانيات المدونات العربية من خلال 
مشروع مدونة النصوص العربية الفصحى لتعليم اللغة العربية بمساعدة الحاسب 
011 [8 و1طه:]ث. وكان الهدف من هذا المشروع إنشاء مصدر لغوي لمتعلمي 
اللفة العربية. يحتوي على قاعدة بيانات للنصوص العربية ومعجم للمفردات 
(81 »© أأعكاء810 1584 ) . وعند إنشاء المدونة؛ كان عرضن النصوصى العربية 


وتحريرها يتطلب أجهزة وبرامج خاصة للحاسب الآلي من شركة أبل ماكنتوش, 
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وك ثمانينات القرن الماضي لم تكن إدارة الحاسب الآلي 4# جامعة ليدز توفر 
حاسبات لتعليم اللغة. حيث كان استخدام هذه الأجهزة مقصورًا على أبحاث 
العلوم والهندسة. ومن هنا رأينا أهمية إيجاد وسائل تمكن المختصين من الوصول 
إلى المدونات العربية بسهولة ودون أية قيود لكونها مصدرًا لغويًا مهما البحث 
والتعليم. 
المدونة اللغوية للعربية المعاصرة ( 412012 001222013177 01 5م001 عطأ :ع0 ) 
كانت أبحاث لسانيات المدونات 4# جامعة ليدز قد طُوَّرتٌ # بداياتها بعض 
المدونات وأدوات التحليل الخاصة باللغة الإنجليزية: ولكي يتم التوسع ب هذه 
الأدوات لتشمل اللغة العربية فقد قامت بإنشاء أول مدونة لغوية عربية واتاحة 
تنزيلها مجائاء وتشمل مليون كلمة من اللغة العربية المعاصرة (0صدنائةان1-5م 
1اء7ث .)3٠١1٠06‏ صممت هذه المدونة لتكون قابلة للمقارنة مع مدونة -2هآ 
08))) 5رنام:ه0) دععنء035]6-0510-8) للإنجليزية البريطانية المعاصرة التي 
تشتمل على مليون كلمة؛ وكذلك مدونة 8701833 للا نجليزية الأمريكية المعاصرة: 
وفيها مليون كلمة أيضًا (2119838 »© طعوعنآ ) . وعوضًا عن استنساخ نفس الأنواع 
الأديسة للتستوصتج الومود ةقب ماعن الدوتخيو فكدن إن تظلسية أززاء مجبيهة 
من المستخدمين المحتملين لهذه المدونة # مجالي تعليم اللفة وتحليل النصوص 
العربية؛ للتعرف على مدى تفضيلهم لأنواع أدبية محددة: ومن ثم ضمنت هذه 
الأنواع.ة المدوتة :وقد استخدمت المدوثة اللثوية للعزبية المفاضرة من قيل غذذ 
من الباحثين # مجال لسانيات المدونات العربية وذلك لعدة أغراض بحثية: منها 
على سبيل المثال: تعليم الهجاء والمفردات # اللغة العربية (21 أ© 81801 ,)3١١7‏ 
وتصنيف المعاجم العربية (21 ]© 4113 :)2١١١‏ وعمل معجم لما يكتب متصلا 
بالعربية (10115 320 15131132: :)3٠٠١‏ وترجمة المجازات ذات الصبغة الثقافية 
ل# المقالات العلمية (15ع1608 320 1آطءع71131 ؟7١١3):‏ والاختلافات المعجمية 2 
قسمي الشؤون الدولية والرياضة 4# الصحف العربية (عل11328 ابالطكة 2)5١١١‏ 
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ومنها أيضًا الدراسات القائمة على المدونات 4# علم اللفة الاجتماعي (17218108[1 
1207 لمة .)5١ ١‏ 


مدونة الانترنت العريية ( 15ام001) أعميعام] عأطوتك) 

كانت المدونة الوطئنية البريطانية (115م001) 13610021]! 811151 :82210 ) 
تسعينات القرن الماضي تمثل معيارًا مُعتَمَّدًَا ‏ مجال لسانيات المدونات 
الإنجليزية: ولم يكن هناك تمويل وخبرات كافية لبناء مدونات عامة وكبيرة لأي 
من اللغات الأخرى لتحاكي المدونة الوطنية البريطانية مئّة مليون كلمة). وللتغلب 
عا ذلك عقب حاور ك متوسرة لار هت اح مهدو بداشرعة الإتفرنات رامقايها مدو 
لغوية (8612310121 8231001320 : 2٠١‏ ): مما طلب تحديد قائمة من الكلمات 
تمثل اللغة الهدف وتُستخدّم من قبل برامج خاصة تقوم بجمع مواد المدونة. وذلك 
بإرسال مجموعة من هذه الكلمات للبحث عنها ‏ محركات البحث المعروفة على 
شبكة الإنترنت؛ مثل ©00081) و800هلآ و8128 وغيرها ء ومن ثم تنزيل صفحات 
النتائج؛ وتصفية النصوص. ثم تجميعها ك4 مدونة واحدة. و4 جامعة ليدز اتبعَتَ 
هله المتهيجيبة (باعتيان:الإنتزنت مدونة لقوية كبرى) لتجمع مدوتات من الإتثرنت 
للغة العربية؛ والصينية» والفرنسية: والألمانية: والإيطالية: والإسبانية: والبولندية, 
والروسية .)73٠١15131015(‏ وهي مدونات متاحة للجميع من خلال واجهة لكشاف 
السياقات والمتصاحبات على الموقع التالي: -آ2]6 /كعلنا.عة.كلعع5.1نام1م»//:ماغط 
[تتاط.)6م. وتشمل مدونة الإنترنت العربية ١76‏ مليون كلمة؛ وقد أضيفت الأصول 
المعجمية إلى كلماتها 4 وقت لاحق باستخدام برنامج التحليل الصر 5411/4 
(لأع تلخ لطة قطلهككة5 3؟١1١5).‏ 


مدونة اللغة العربية حول العالم (15م001 عأطوتتكى عل171771 110110) 
جمع الباحثون .4# جامعة ليدز مدونة لغوية عربية من أنحاء العالم (8155:611. 
)3٠١307 1‏ مماثلة لمدونة اللغة الإنجليزية حول العالم طاوتاعم8 عل17171 177/0110 


١ 


5 وتشمل مدونات فرعية تتألف كل واحدة من مئتي ألف كلمة من كل دولة: 
وذكك لززاسة لكلف الليجات موسلك النطلس وقد كوت نه المدؤنة 
لدراسة التنوع بين لغات الأقطار العربية (أوما يعرف باللهجات) 4# استخدام 
أدوات الوصل (81 66 7135582 3١١57٠٠١‏ ), وكذلك التباين 4# اللفة العربية 
وإنجليزية العرب 2# العالم العربي (21 اء [[15ة .)53٠١5‏ 


المدونة اللغوية لتدريس معلومات عن الاسلام (221ا5]آ 300104 عمتطعمع]' :10 قنامه0)) 

استّخدمت شبكة الإنترنت - باعتبارها مدونة لغوية - لجمع مدونة تخصصية 
تضم النصوص المستخدمة لتدريس معلومات حول الإسلام للمستوى الجامعي (-4.1 
1 أء 611 3١١١‏ ): وذلك من أجل تأليف موسوعة جامعية لاستخدامها 4# تدريس 


الطلاب عن الإسلام والمسلمين, وتشمل اللغة: واللسانيات, ودراسات المناطق. 


البنك الشجري للخطاب العربي (علطواءء11 ء5تدامء15(آ عأطوعم) 

يحتاج تحليل الخطاب ‏ اللغة العربية إلى نوع مختلف من وسم الكلمات (وهو 
مايعرف بالتحشية 2014860مة) : وقد أنشأت الباحتتان 11عع1/]811 سه عن 1-5م 
)٠١(‏ البنك الشجري للخطاب العربي؛ وهي مدونة تشمل 077 نصًّا إخباريًا 
قد وُسمَّتَ جميع أدوات الوصل فيهاء إضافة إلى العلاقة التي تربط كل أداة مع 
طرفيها. وقد تطلب هذا تطوير أداة حاسوبية لوسم الخطاب 4# النصوص العربية: 
وكذلك إنشاء موقع على شبكة الإنترنت لنشر المدونة. 
المدونة اللغوية لمتعلمي اللغة العربية ( 5نام001) اعمتدع.][ عأطوتة :عله ) 

أنشئت المدونة اللغوية لمتعلمي اللغة العربية لتكون مصدرًا لغويًا لأبحاث تعليم 
اللفة العربية, وكذلك للبحث 4 مجال معالجة اللغة الطبيعية (-41 320 11515لظ 
34 أ 41191 ,201323 77:611) . يمكن تنزيل نصوص المدونة من شبكة الإنترنت 
مجاناء وهي تتألف من مجموعة من المواد المكتوبة والمنطوقة التي حررها متعلمو 
اللغة العربية # المملكة العربية السعودية خلال العامين 7١١17‏ و17١7:‏ وتضم ١0/0‏ 
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نصًًّا(؟787757 كلمة). شارك 4# تحريرها 1:7 طاليًا من 17 جنسية:» و57 لغة 
أم مختلفة: ويبلغ متوسط طول النص الواحد 17 كلمة. وتضم نصوص المدونة 
نوعين أدبيين: الأول سردي يحكي فيه الطالب رحلته 4# إحدى الإجازات, والثاني 
يناقش فيه الطالب اهتماماته الدراسية ومستقبله العلمي. ويستطيع الباحثون من 
خلال المعلومات الوصفية للطلاب والنصوص (1726130212) التعرف على خصائص 
النص اللفوي وكذلك مؤلف النصء مما يضيف عمقًا أكثر لتحليل بيانات المدونة, 
كما تفيد أيضًا 4 مجالي التعرف الآلي على النص المكتوب بخط اليد؛ والتعرف 
على الكلام المنطوق. كما أن أصول الأوراق - المكتوبة يدويًا من قبل الطلاب - 
متاحة للتنزيل يعد أذ مكلت موؤستويق كاي الضوئي. ثم حفظت 4# ملفات 
بصيغة "21(1. وكذلك الحال بالنسبة للتسجيلات الصوتية لأولئك الطلاب الذين 
أذنوا بنشرها على الإنترنت؛ فهي متاحة للتنزيل # صيغة صوتية رقمية 1/153 (ما 


سَمَيَتَ ملفات المدونة بطريقة تسمح بالتعرف على الخصائص الأساسية 
للنصص وكذلك المؤلف. نحو: 5038_12_21_2:6_2/2145_177_0: وهي بالترتيب 
من اليسار: رقم الطالبء رقم النص؛ جنس الطالب. المرحلة العامة؛ ناطق بالعربية 
باعتبارها لغته الأم أو ناطق بغيرهاء نوع النص (مكتوب آم منطوق)؛ مكان تحرير 
أوتسجيل النص ( 4# الصف أو خ المنزل). يمكن تنزيل نصوص المدونة من موقعها 
الرئيمس (110://9/17/177.31:3116162126101:0115.6012) ؛ كما يمكن البحث فيها عن 
طريق الإنترنت من خلال الموقع التالي (حمء. اع توعد 5/.1//:ماغط) أو موقع 
عماعمططعاععاد (لد أه اكتتتدع 111 )٠١ 1١:‏ . استخدمت هذه المدونة 4 تقنية تهدف 
للتعرف على النصوص التي حررها الناطقون باللفة العربية وتمييزها عن تلك التي 
حررها الناطقون بغير العربية (2001(1535 213150251 :)73١ ١5‏ وكذلك تصحيح 
الأخطاء آليًا (21 اأء غنطه]2 .)7١١5‏ 


يفن 


المدونة العربية للغة القرآن الكريم (15ام001) ع أطوتكى عنطة1ن01©) 

بعد إصدار المدونة اللغوية للعربية المعاصرة ( 00116100018177 01 115م001) 
131 ) ظهرت عدة أنواع من المدونات العربية المتاحة للاستخدام؛ لكن نصوص 
القرآن الكريم؛ وكذلك نصوص اللغة العربية الفصحى. لم تجد نفمس العناية 
من قبل المهتمين ببناء المدونات العربية. ولذا تعد المدونة العربية للغة القرآن 
الكريم 0015 عأطهتة عتصة 00 (212013 أه 5عع1نا) من أشهر المشاريع 2 
هذا الجانب. فقد بُنيّ هذا المصدر اللغوي من خلال شراكة انطلقت من جامعة 
ليدز. وتحوي هذه المدونة عدة طبقات من الوسم؛ مثل أقسام الكلام بعد تجزئة 
الكلمات بناء على الوحدات الصرفية (2010 ,1130351 320 5ع1212 ): والتحليل 
النحوي القائم على التوابع (21 اء 5عع1نا(آ ,2010 ,1عغ21تكاعنا8 لصة وععلند1 
0 والمعاني الإنجليزية لمفردات القرآن العربية. وكذلك الترجمة الإنجليزية 
للآيات. وتضم المدونة أيضًا تسجيلات صوتية لتلاوة الآيات: إضافة إلى تصنيف 
الموضوعات 2# القرآن الكريم. وكان الدافع لهذا المشروع إنتاج مصدر يساعد على 
فهم القرآن الكريم: وإجراء المزيد من الأبحاث على نصوصه. ويمكن القول بأنه 
يختلف عن المشاريع الأخرى بتوفيره مادة لغوية أكثر عمقّاء تقوم على تحليل قواعد 
اللفة العربية حسب المنهج العربي المعروف بالإعراب. وقد بات بالإمكان من خلال 
تبني هذا النهج تحفيز الباحثين اللغويين والشرعيين للعمل على موضوع التحشية 
بأسلوب تعاوني عن طريق الإنترنت. حيث يُستخدم الوسم الآلي المبني على قواعد 
محددة هذه الطريقة الجديدة لتحشية المدونة لغويّاء مع إجراء تدقيق يدوي 
أولي؛ ثم القيام بالتصحيح عن طريق الإنترنت من قبل الباحثين المتعاونين. وقد 
استفاد الوسم الصرك لمدونة العربية لنصوص القرآن الكريم من الجهد الذي 
قدمه مئة متطوع تقريبًاء وذلك على شكل اقتراحات لتدقيق الوسم اللغوي للمدونة. 
كما كان هناك دور إشراك لعدد قليل من المختصين 2 عملية الوسم؛ بحيث يقبلون 
اقتراحات التصحيح المقدمة عن طريق المتعاونين أو يرفضونها. كما استفادت 
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المدونة كذلك من الكم الكبير للتراث النحوي العربي الى قاد 4 ادن تعليقات 


الباحثين على نصوص المدونة. 


التحدي الأبرز الذي واجه عملية تحشية نصوص القرآن عن طريق الإنترنت 
تمثل 3 الحاجة إلى بناء برنامج خاصء عبارة عن منصة عمل تساعد على الوسم 
بأسلوب تعاوني: ومن هنا بدأت فكرة بناء منصة التحليل اللغوي متعدد الوسائتط 
(2121012 20031نا1نك/ة 15دنرتأمصط عتاأئ1اداومآ :طللخ[) (-نخ لله دعكانادآ 
5١١79611‏ ). استخدمت المدونة العربية لنصوص القرآن الكريم كمصدر معياري 
لعدد من الأبحاث التي أجريت على اللغة العربية الفصحىء. ومن هذه الأبحاث 
استخراج جذور الكلمات العربية (21 551501614 .)23٠٠١‏ والتحليل النحوي للغة 
العربية (2011 ء1685016 ,2011 01231 820 060تحتتة[110) ؛ واستخراج البصمة 
الأسلوبية 4# اللغة العربية ( 1011501108 21 ]6 داءعم11ال1ث ) ؛ وتحليل الترابط 
ل دراسات الترجمة العربية (0اتططة/1 300 18:21 »)٠١١‏ والتلخيص الآلي 
(8لطامعط:10 21 غه [81-113) . وتحليل الصيغ الشفهية (65أو1صصة8 )3١١5‏ . كما 
كان للمدونة أثر اجتماعي كبير تمثل 4 مليون زيارة لموقع المدونة خلال عام واحد. 
ولق ظهرة هؤلاة النزوار ناطفون بلعات هيو الكزبية قادتيم للامتمادة من البونة 
رغبتهم 4 الوصول إلى فهم أعمق لنص أصيل من اللغة العربية الفصحىء وذلك 
بالاستفادة من التحشية اللغوية المستخدمة #4 المدونة. 
مدونة الاحالة الثنائية لضمائر القرآن الكريم (-210 01132 :3كئن01 
15 ععطع 00-1611 11م مفمث حتامم) 

تعد مدونة الإحالة الثنائية لضمائر القرآن الكريم (455611 0مة 53184 
8) مدونسة غنية من حيث التحشية كقد وسمت جميم الشماكر الشخصية 
فيها بمعلومات عن العائد الذي يشير إليه الضميرء سواء أكان العائد سابقًا للضمير 
أم كان لاحقًا له وهو الغالب# المدونة. كما شمل الوسم كذلك العائد نفسه. أي 


هم 


الكلمة أو الجملة التي تحوي المعنى: أو الشخص. أو الكيان:ء أو الفكرة التي يشير 
إليها الضميرء ولهذا سميت بمدونة الإحالة الثنائية لشمول الضمير وعائده 2 
التحشية. 4# هذه المدونة وَسّم الباحثون ما يزيد عن 7+.5٠١‏ ضمير بمعلومات 
حول العائد؛ وكذلك أكثر من ألف عائد - تتكون من أسماء وعبارات - بمعلومات 
عن الأشخاص. أو الكيانات:؛ أو المفاهيم: وذلك لجميع الأسماء أو الجمل التي تشير 
إليها هذه الضمائر. لم يكن من السهل تحديد العاكد لجميع الضمائر الشخصية 
4 القرآن الكريمء لكن كتب التفسير وكذلك كلام العلماء حول هذه الضمائر كانا 
بمثابة الدليل للقائمين على تحشية المدونة. و4 بعض الحالات الخاصة حيث يكون 
للضمير أكثر من عائد؛ فقد اتبعنا ما ورد تفسير ابن كثير الذي يعد مؤلقًا 
مرجعيًا # تفسير القرآن الكريم: وقد اعتّمد عليه بدرجة كبيرة # تحديد العائد. 
مع الأخذ كذلك بدرجة الاتفاق بين العاملين على تحشية المدونة حول عائد الضمير. 
وتعد هذه المدونة أول مدونة للغة العربية الفصحى يمكن تنزيلها مجانًاء مع كونها 
موسومة بهذا النوع من المعلومات عن الضمير وعائده. 


مدونة الترابط الدلالي بين آيات القرآن الكريم (010130) :01115100© 
كا 01 5ه اتستة عوه؟1 ) 

مدونة الترابط الدلالي بين آيات القرآن الكريم (611ة لصة 5131524 
12) تمثل إضافة جديدة #9 مجال التحشية اللغوية على النص القرآني: غفي 
هذه المدونة - المتاحة مجانًا للباحثين اللغوين المهتمين ببحث موضوع التشابه اللغوي 
والعلاقات الدلالية بين آيات القرآن الكريم - وسمّتٌ الآيات التي بينها علاقة من 
نانجية الالال موق اأعنييا الماتكون طاى عبوز ابن عجريف النشقرا ب اسل ةفاح ديق 
آيات القرآن الكريم؛ حيث يشير ابن كثير إلى الآيات ذات الصلة 4 معرض تفسيره 
لكل آية:» وقد مكن ذلك من استخراج العلاقات المرجعية بين هذه الآيات والتي 
زاد عددها عن 7.1٠١‏ علاقة مشتركة. نشرت 'مدونة الترابط الدلالي بين آيات 
القرآن الكريه'"' على الموقع التالي على شبكة الإنترنت (.6010582 1ع متطن/لاء:ء1' 
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) حيث يستطيع المستخدم رؤية شبكة العلاقات المباشرة وغير المباشرة لأي آية 
من آيات القرآن الكريم. وقد أظهر تحليل المدونة أن 457 فقط من الآيات المرتبطة 
ببعضها تشترك كلماتها # نفس الجذرء مما يدل على أن الارتباط بينها يتجاوز 
التطابق المعجمي للألفاظ إلى المعنى الدلالي والمجال المعربي. يمكن استخدام 
هذه المدونة لاستخراج الموضوعات الواردة 4# القرآن الكريم وتصويرها من خلال 
العلاقات الدلالية بين الآيات (2014 نازهة2 )»؛ ويما أن ابن كثشير قد تحدث 2 
تفسيره عن علاقات النص القرآني وهو نص عربي فصيح , فهذه العلاقات مصدر 
جيد يمكن الاستفادة منه # أبحاث ترجمة معاني القرآن الكريم؛ ومن ذلك على 
سبيل المثال أن الآيات التي بينها ارتباط 2# اللغة العربية ينبغي أن تبقى كذلك عند 
ترجمة معاني الآيات إلى أي لغة أخرى. وبالتالي فقد تكون هذه المدونة مصدرًا 
للبحث ْ ترجمة معاني القرآن الكريم للغات الأخرى. وخصوصًا 4 موضوع الآيات 
الرتيملة دلاليًا والفاذكة بيتها: 
مدونة القرآن الكريم الموسومة بموضوع الآيات مع الترجمة 
الإنجليزية (-512مة11 اوناعطط 17/111 01210 نمك 5نام 001 120لا :001110077 
15م عؤلء/؟ 0ه كمه ) 
مدونة القرآن الكريم الموسومة بموضوع الآيات مع الترجمة الإنجليزية 
018 (2013 1اعنتاث لصة كدطاطاخ ,2009 مقططكث) عبارة عن أداة قائية 
اللغة (إنجليزي - عربي) ذات قدرة على تحسين الدقة والاستجابة (300 160211 
2 عند البحث 4 موضوعات القرآن الكريم, وقد أمكن تحقيق هذا من 
خلال الجمع بين عدة أنواع من التحشية. حيث وسمت كل آية من آيات القرآن 
العريغ يمعلوماك عن الموضوع الدلاتي الذي تحتوية: والذي استخرج من مصاحف 
التجويد" . وهو مرجع موثوق يحوي فهرسًا لما يقارب ألما ومئة من المفاهيم 
والموضوعات مع الآيات المرتبطة بها. وقد حول الباحثان فهر مس هذا المصحف 


إلى تصنيف يعرضها بصورة شجري يمكن استخد امه من خلال موفع المدونة 


يفن 


على شبكة الإنترنت. حيث يستطيع المستخدم التنقل بين شجرة التصنيف لإيجاد 
الفكرة المطلوبة؛ ومن ثم الوصول إلى قائمة بالآيات المرتبطة بها. كما وسمّتٌ كل 
آية بثماني ترجمات إنجليزية مشهورة لمعاني القرآن الكريم» فبات بالإمكان إيجاد 
الآيات القرآنية من خلال البحث 2# هذه الترجمات الإنجليزية باستخدام أي كلمة 
أو كلمات مفتاحية؛ كما يمكن للمستخدم مشاهدة مجموعة من مرادفات الكلمات 
المفتاحية المستخدمة 2# البحث, والاستفادة منها ب توسيع نطاقه وبالتالي تحسين 
جودة النتائج. بإمكان المستخدم أيضًا الوصول إلى بيانات هذه المدونة وتنزيل 
محتواها على شكل صفحات مكتوبة بلغة النصوص المتشعبة .1111/[1, وتشتمل كل 
صفحة من هذه الصفحات على آية واحدة مع ترجماتها الإنجليزية: وكذلك قائمة 
مصحف التجويد للموضوعات المرتبطة بها. تتوافق لغة .1117/1 هذه مع معايير 
محرك البحث هما0008. حيث يمكنك قصر البحث ث هذا المعحرك على موقع 
إنترنت محدد باستخدام العبارة (©]51) مع كلمات البحثء فعلى سبيل المثال 
تقوم عبارة البحث التالية: 


"'لمغط/ه مم علسعة. كلمع 1 . ممع وس //:ماخطا عازه 1" بإيجاد جميع 
الآيات التي ورد ذكر الصلاة 4 ترجمات معانيهاء أوورد ذلك 4# قائمة موضوعات 


مدونة جامعة الملك سعود للغة العربية الفصحى (111285 ذل._). /51كآ 
عأطدعك 12551221 01 115م01) 77اأوناء كتمتا 52110) 

يمكن دراسة الأنماط المعجمية 2# القرآن الكريم باستخدام أي كشاف 
للسياقات متوافق مع اللغة العربية مثل ©2)20131)0101: لكن الباحثين اللغوين 
وستاغ لفاحم يعتاجون إلى مدوناك كيرة لدوانئة المتصناعيات اللغوية والتهااج 
المناقتحة رتكا نلفة ويف النفلة الاتحليرية عله سيبل الكتان: أنشكت المدوقة 


الوطنية البريطانية لتكون أساسًا للبحث المعجمي. وهي تحتوي على مئّة مليون 


كن 
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كلمة: أما يك اللغة العربية الفصحى فالنص القرآني يحتوي على خمسين ألف كلمة 
تقريبًا (بناء على طريقة احتساب حدود الكلمة)؛ ولأن البحث # الدلالة التوزيعية 
لمفردات المعجم يحتاج إلى عدد كبير نسبيًا من الأمثلة لكل كلمة أو متصاحب لغوي 
للتمكن من دراسته؛ ولآن كثيرًا من الكلمات والعبارات # القرآن الكريم لم ترد 
إلا لغ مواضع قليلة؛ فقد تعاونت جامعة ليدز مع جامعة الملك سعود لإنشاء مدونة 
تحوي خمسين مليون كلمة من اللغة العربية الفصحى القريبة من فترة نزول القرآن 
الكريم» وهذه المدونة هي مدونة جامعة الملك سعود للغة العربية الفصحى ( -4153/ 
,1148 ,212013 اه طةذط) . وقد سمحت لنا هذه المدونة بإيجاد كثير من الأمثلة 
والسياقات لكلمات وردت 2# القرآن الكريم» وهي مدونة يمكن تنزيل محتوياتها 
من موقعها الخاص على شبكة الإنترنت (110://125116012115.1511.6011.52) ؛ كما 
يمكن البحث فيها باستخدام موقع عطأعصططعاءء51 ( 2014 1ه أء التصدع 1ك ) . 
هذه المدونة تعد مفتاحًا للدراسات اللغوية التاريخية القائمة على المدونات (-1ىم 
3428 6 12135) وكذلك دراسات الدلالة التوزيعية لمفردات القرآن الكريم 
(20146 21 اء طممتطوناة ) . 


“. أدوات تحليل النصوص العربية 

من المهم ْ ظل تنامي استخدام المدونات اللغوية وجود أدوات حاسوبية 
تستطيع الإغادة من هذه المصادر اللغوية: وبسبب الخصائص الفريدة للغة العربية 
فإنها تحتاج إلى أدوات تستطيع التعرف عليها ومعالجتها بطريقة صحيحة؛ وقد 
صمم الباحثون 4# جامعة ليدز مجموعة من الأدوات المخصصة لمعالجة اللغة 
الفزبية نشغرصها هذا القسم: 
الكشاف السياقي 200200106 تلغة العربية (-0022010552) 3200200106 
عاطوتخ 101 عه ) 

من الملاحظ أن كشافات السياقات المتوفرة قبل عدة سنوات لم تكن مصممة 
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نكا بحم تحط تس لمكو ةلتسن الخري انس اند د اط ف ونه 
الحروف العربية عن تلك اللاتينية» والتباين 2# معايير تمثيلها حاسوبيًاء واختلاف 
رسم بعض الحروف بناء على موضعها 4# الكلمة؛ ومن تلك الخصائص أيضًا عدم 
رسم الصوائت القصيرة ( الحركات) ف كثير من الأحيان. والتباين ‏ طريقة 
استخدام علامات الترقيم: وكذلك كتابة النص العربي من اليمين إلى اليسار, 
والذي أبرز الحاجة إلى تبديل نافنتيٌ "الكلمات السابقة" و" الكلمات اللاحقة" 
4 برامج كشافات السياقات لتلائم اتجاه النص العربي. ولهذا فقد بُتيّ كشاف 
السياقات 200200106 4# قسم الحاسب الآلي بجامعة ليدزء وهو أداة مجانية 
ومفتوحة المصدر. صممت 2# المقام الأول لمساعدة الباحثين # لسانيات المدونات 
العربية (2006 ,2005 21 66 12056115) . وقد أشادت دراسة علمية أجريت حول 
كشافات السياقات # ذلك الوقت ( 2006 5طنا1 820 ممهدصطاءء111 ) ببرنامج 
6 الذي يوفر دعمًا كاملا للنصوص العربية؛ ويتمثل هذا الدعم 4 عدة 
جوانب منها واجهة المستخدم التي يمكن تحويلها بين اللغتين العربية والإنجليزية: 
وتبنيه لترميز الحروف المعياري 1/210006؛ إضافة إلى دعمه لمجموعة من الخطوط 
العربية, وكذلك اتجاه النص العربي من اليمين إلى اليسار. وبعد عقد من الزمن 
أجوى تحييه أخر تانوات المستخدمة # تحليل المدونات العربية (20ة 1148آاهك 
8 1ك ) حيث وجدت الدراسة أن معظم الأدوات ما زالت تعاني من 
مشاكل 4# دعم اللغة العربية. وقد اسستخدام 00 #ة عدة دراسات 4 مجال 
لسانيات المدونات العربية؛ ومن ذلك الكشف عن الأنماط المعجمية الشائعة ‏ 
النصوص العربية ( 101152011125 21 أه [81-113 ) ؛ والكلمات والعبارات المفتاحية 
(112012ث)؛ والتعرف على أساليب الجرائم من خلال مدونة إخبارية لتقارير 
الجرائم (2012 '([انقاك) . 
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المحلل الصرية 541114 لوسم أقسام الكلام ك المدونات العريية 
(2137515طث 2/1010101051631 عء3281128آ عأطفتث 512201310 :خاللا آذ د) 

أسهم الباحثون 4# جامعة ليدز :ك# مشروع وسم مدونة 108 للإنجليزية 
البريطانية المعاصرة (19830 21 اء داععه.] ,1982 4655611) ؛ وقد منحهم ذلك 
خبرة استفادوا منها 4 وسم المدونات العربية (21 غء 17611ش ,2008 1اعنتام 
98 ). حيث جرى العمل على تطوير أداة للتحليل الصرٍي. وكذلك وسم أقسام 
الكلام # المدونات العربية؛ إضافة إلى بعض الوظائف الأخرى. وكانت البداية 
بوسم عينة قصيرة من القرآن الكريم إضافة إلى نص إخباريء لتكون هاتان 
العينتان بمثابة معيار يمكن الاعتماد عليه لإجراء مقارنة بين المحللات الصرفية 
الحالية (2008 11ع:41 2120 5372112 ) . كما جرت مقارنة بين منهجين لتحليل 
اللفة العربية صرفيّاء يقوم الأول على أساس القواعد اللفوية؛ بينما يعتمد الثاني 
على المدونات اللغوية ( 2009 415611 320 5317:2152 ) . قادت هذه الدراسات إلى 
تطوير أداة جديدة أطلق عليها 541.114.: وهي أداة لتحليل الوحدات الصرفية 
الصغرى# اللغة العربية -1101 320 13851285 ' اعءعءم 2311-01-5 115م001) ع1اطوكم 
55 01010851023: مع وسمها باستخدام جدول الوسم الصر لأقسام الكلام 
المضمن 3# هذه الأداة. 

والاسم 541114 يشير إلى: محلل ليدز الصر لصوالحة وأتويل 5215:018 
5ف أنننع مامطم:ه21 دلععآ لاعوطة (20132 1اعدنث لمة قطلةة5 ) أو 
المحلل الصربك للغة العربية الفصحى -1101220 1212511286آ 413612 51220210 
3195م انم نع10 (2013 21 أ 95312158 ) . ويشتمل على مجموعة من الأدوات 
لتحليل المدونات العربية: ومنها جدول معياري لوسم أقسام الكلام: يأخذ بعين 
الاعتبار السمات الصرفية الأصيلة للغة العربية (20136 46511 0مة 5352152 ) ؛ 
وكدتشهيرو ها" الذمق معليلذ اباك اللموين العزب القدماء واشعك انها اسان 
للجدول اجات الدي يفظق تصحيفًا شاملا :ومضلا لبنية الكلمةنف اللقة العربية: 


:١ 


ومع وجود عدد من الجداول الأخرى لوسم أقسام الكلام: والتي أَعدَّتَ للقيام بمهام 
محددةك اللغة العربية:. إلا إنها ب الغالب إما مستفادة من نماذج أعدت للغة 
الإنجليزية: أوإنها تفطي جزءًا محدودًا فقط من الدراسات الصرفية العربية, 
ولهذا فقد أنشي مقيامس لمقارنة وتقييم جداول أقسام الكلام كجزء من المشروع 
الحالي. وقد أضيف إلى أداة التحليل الصري وجدول أقسام الكلام معجم عربي 
كبير مستمد من المصادر المعجمية مفتوحة المصدر على شبكة الإنترنت: وكذلك 
المعاجم التراقية للغة العربية (201050 415611 300 5352152 ) : كما أضيفت 
كذلك ميزة لعرض للتحليل الصرك العربي بطريقة مرئية؛ حيث تظهر الوحدات 
الصرفية مميزة بألوان مختلفة عن بعضها ليسهل تمييزها بصريًا (هطلة531 
2 3004561 ) . وللتحقق من جودة عمل هذه الأدوات على المدونات الكبيرة, 
فقد تمت تجربتها على مدونة الإنترنت العربية التي يصل حجمها إلى ١75‏ مليون 
كلمة (61120138اة 0هة 53:18 ) : كما استخدمتٌ 4# مجموعة من الأبحاث 
مجال لسانيات المدونات العربية؛ ومنها إنشاء قوائم بالمفردات اللغوية لتعليم 
اللغة العربية (21 ]151153111116 :)٠١١4‏ وتعليم الهجاء والمفردات العربية (-11 
32 4ه 1201) : وكذلك التحليل النحوي العربي (2011 1830166) : وأيضا تحليل 
وسائل التواصل الاجتماعي العربية (2013 1لى حمة 11280 181-8) . 


جدول وسم الأخطاء 4 مدونات المتعلمين العريبية (2ءدتدع.آ ءأطوتىم 
أ 1398-5 :1101 كلام 001 ) 

أنشيىّ جدول تصنيف الأخطاء لاستخدامه 4# وسم الأخطاء اللغوية ب مدونات 
المتعلمين العربية (20145 .2012 11ع'لث 320 قلتكاخ .2013 21 أء كمتكاذ ) . 
وقد استفاد هذا التصنيف من مجموعة من تصنيفات الأخطاء المصممة لمدونات 
المتعلمين ليكون مناسبًا للأخطاء اللغوية التي يقع فيها متعلمو اللغة العربية. 
استخدّم هذا التصنيف لتطوير أداة هي عبارة عن محرر لوسم أخطاء الطلاب 
4# المدونة اللغوية لمتعلمي اللغة العربية ( 2015 415611 300 4110115 ) : والذي يمكن 
الاستفادة منه # وسم أي مدونة من مدونات المتعلمين. 


: 
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الوسم الصوتي والمقطعي للغة العربية (2:050012 0ه عتأعصمطط علطوتى 
8 2) 

نوع آخر من أنوع الوسم يتمثل 2# كتابة النصوص صوتيًا - ومنها نصوص 
القرآن الكريم - وذلك لعدة أهداف وتطبيقات كالتمكن من قراءتها بصوت 
مسموعء والتعرف الآلي على الكلام المنطوق. يستخدم علماء الأصوات الألفبائية 
الصوتية الدولية 14 (أء86طماخى ءن1اعممطاط 122610221ع )م1 ) لكتابة النصوص 
الملنطوقة # مختلف لغات العالم: ولآن رسم اللغة العربية لا يعبر عن طريقة اللفظ 
بدقة كبيرة؛ إضافة إلى أنه لا يوجد ربط مباشر بين كل واحد من الحروف المكتوبة 
اللغة العربية مع رموز الألفبائية الصوتية الدولية 471: فقد بُنَيّ نظام دقيق 
للربط بينهما مع كتابة النصوص العربية صوتيًا وبطريقة آلية, وقد بني هذا 
النظام على تحليل لتلاوة القرآن الكريم وأحكام التجويد كالوقف والغنة ونحوهماء 
إضافة إلى الاستفادة من مجالي اللغويات العربية وعلم الأصوات الحديث (-8:161 
4 ]3 أء 5211:2112 ,ع تامع 1011 21 أء 167 ) . ويتضمن النص.ى القرآني على 
وجه الخصوص رموزًا مقطعية تشير إلى عدة أنواع من الوقف أو حدود الجملة التي 
ينبغي مراعاتها عند قراءة الآيات بصوت مسموع. وهي جزء من أحكام التجويد 
التي تضبط عملية النطق والوقف أثناء تلاوة القرآن الكريم. وقد استّخدم نظام 
الربط بالألفبائية الصوتية الدولية؛ وكذلك رموز المقاطع.: 2# التحشية الصوتية 
والمقطعية للمدونة العربية للقرآن الكريم الموسومة بحدود الوقف # النص القرآني 
(2120123:5 غء 81161166 ) . يمكن أن تساعد هذه المدونة غير الناطقين باللغة 
العربية على تعلم التلاوة الصحيحة لآيات القرآن؛ كما يمكن أن تستخدم لتدريب 
أدوات الوسم المقطعي لنصوص اللغة العربية بما ب ذلك اللغة العربية المعاصرة 
(طي2012 21 أء قطلهككة5 ) . 


وف 


تدريب برامج التخاطب الآلي على مدونة عربية (-15ام001 غ1أ10ىم 
15 0ع مطنة1 1 ) 

من الاستخدامات المبتكرة للمدونات استخدامها 4 تدريب برامج التخاطب 
الآلي عن طريق الإنترنت. والتي تقوم على أنظمة تعلم الآلة عمنصتةع.آ عصنناعة]/1 
(20052 1اء'تاث 300 :512131 نااك ) » ومن ثم تستخدم هذه البرامج بعد التدريب 
كأداة لاستكشاف المدونات نفسها (20055 415611 800 513:31 نالك ) . وكمثال 
على ذلك؛ فقد جرى تدريب برنامج للتخاطب الآلي على مدونة قرآنية. وهوما 
أنتج لنا نظام تخاطب عربي يعطي إجابات من القرآن الكريم (300 ننة'5815 نانالث 
1ل4156 ٠١5‏ ).: كما دربت نسخة أخرى منه على مدونة للأسئلة الأكثر شيوعًا عن 
الحوسبة العربية: ليقوم بالإجابة على أي سؤال حول هذا الموضوع (53135 نااك 
9 1ع تاك لطة ) . 


الوسمالدلالي والتمثيل المعريث للغة القرآن الكريم (-1928 561021112 
أطخ عنطة1ا0) 101 0ه أمعوع1مع 13 عع0ه0011كا لنة عطاع ) . 

تم إضافة الكثير من مستويات الوسم اللفوي للنص القرآني مثل: أقسام 
للجملء والبنية النحوية؛ كما أضيفت عدة أنواع من التحشية التي تمثل معلومات 
معرفية 4# القرآن: ومنها تصنيف الكيانات الاسمية المعروفة بالضمائر الشخصية: 
وكذلك موضوعات الآيات: وعلاقاتها الدلالية؛ وأيضًا ترجمة معاني القرآن الكريم 
إلى اللغة الإنجليزية:؛ ومن هذه الترجمات ما هوعلى مستوى الكلمة ومنها ما هو 
على مستوى الآية. ويهدف الباحثون 2# جامعة ليدز إلى توحيد جميع هذه التحشيات 
اللغوية والمعرفية (2013 41611 320 41535 ,2013 21 أه 46535 ) لإنشاء تصور 
للتمثيل المعرك 2 القرآن الكريم» وذلك للتمكن من إجراء وسم دلالي له (5131814 
4 ,2013 1اعاث عطة ا1تماععاخ ,2009 [11ع اث لطة ) . 


نك 
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5.البحث اللغوي باستخدام المدونات العربية وأدوات تحليل نصوصها 
استّخدمت المدونات اللغوية والأدوات الحاسوبية التي طورها الباحثون 

4 جامعة ليدز لإجراء العديد من الأبحاث # مجال لسانيات المدونات العربية, 
ومن ذلك تعليم اللغة العربية, والمقارنة بين اللغتين الإنجليزية والعربية؛ وهوما 
سنتحدث عنه 4 هذا القسم. 
تعليم اللغة العربية باستخدام المدونات 

من خلال المشروع الرائد )8ل (11161م 2م00 83 18616ى) بئى الباحثون 
قاعدة بيانات للنصوص العربية ومعجم للمفردات لاستخدامهما # تعليم وتعلم 
اللغة العربية (211989 © 1664ء810). وك الآونة الأخيرة استطعنا 4 جامعة ليدز 
تجربة كشاف للسياقات وبرامج للتخاطب الآلي. مستخد مين مدونات على شبكة 
الإنترنت. وذلك بهدف تعليم اللغة العربية ( 2007 ,2005 6621 41-5101311 ) ؛ ومن 
خلال الأبحاث القائمة على المدونات أيضًا أنشئّتٌ قوائم للمفردات اللغوية التي 
تخدم متعلمي اللغة العربية (15115311111©]6212013) : وقد تواصلنا مع مجموعة من 
معلمي ومتعلمي اللغة العربية 4 قسم اللغة العربية بجامعة ليدز الذين يستخدمون 
المصادر اللغوية للمدونات العربية 4 تعلم وتعليم هذه اللغة. كما أن المجتمع المحلي 
للمسلمين أقام مدرسة لتعليم الأطفال اللغة العربية # أيام السبت من كل أسبوع, 
لتمكينهم من قراءة وفهم القرآن الكريم: وقد استمتع الطلاب بنظام التخاطب 
المبتكر على شبكة الإنترنت, والذي جرى تدريبه على مدونة قرآنية ليعطي إجابات 
بنفس اللغة العربية الفصحى المستخدمة 4# القرآن الكريم (800 51215815 تاماك 
4 1ع تتام ) . 


مقارنة اللغتين العربية والإنجليزية القائم على المدونات 
كان البحث 4# جامعة ليدز قد بدأ بمجال لسانيات المدونات الإنجليزية, 
(انظر مثلًا 1983.6 6:81 طوهم.1) ؛ ثم تبعه اهتمام بإجراء مقارنات بين اللغتين 


هء: 


العربية والإنجليزية تقوم على مدونات لهاتين اللغتين» وتشمل هذه المقارنات تأثير 
اللغة العربية على إنجليزية العربء والتنوع ْ استخدام اللفة الإنجليزية 2 العالم 
العربي (212009 66 4157611 ) ؛ كما تشمل كذلك جداول الوسم الصرك وأقسام 
الكلام 4 اللغتين العربية والإنجليزية (4.57611 2110 قطلةنحة5 ,2008 لاعف 
6 »: وأيضًا التمثيل البصري للنبر والوقف 2# نصوص المدونات العربية 
والإنجليزية من خلال تمييز مواضعها # النص بعلامات متباينة الألوان (-18:2161 
2012 31 اه نزع1) . 


كع 
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الخاتمة 


تستخدم أجهزة الحاسب الآلي والمدونات اللغوية على نطاق واسع # أبحاث 
اللسانيات؛ وقد طور الباحثون 4# جامعة ليدز عدة مدونات لغوية وبرامج حاسوبية 
على شبكة الإنترنت للاستفادة منها ب مجال لسانيات المدونات العربية؛ وهي 
أدوات مفتوحة المصدر ومتاحة على شبكة الإنترنت وليست تجارية: آملين أن 
يسهم ذلك 4# استخدامها على نطاق واسع. ويعتبر وسم وتمثيل الجوانب الدلالية 
والمعرفية 4 النصوص العربية - وخصوصًا 2 القرآن الكريم والنصوص الدينية 
اللأخرى - تحديًا للأبحاث القادمة: كما يمثل فهم القرآن حاسوبيًا التحدي الأكبر 
ث4 مجال لسانيات المدونات العربية. 


و 
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المراجع 
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-015آ عتطوعظة كلعع.آ عطآ" .2010 لأمعع]1تة/3 >1 ممه علخ كتدك-ل[مف 
101 5 كنأءع 0022 1015010156 عتطتأوأمصصك علصداءعء]' ع5تتامء 
5 121851128 :118:02010.آ 01 دع تتلءءء220 ت.ع1طوقم 
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35 2 051 تؤنوع0 عطآ" .2006 .لاعوطة 8 له نآ عتاأته[تك-لىف ‏ .15 
5 05 0111281[ 0221ة تاعاس1 ".عتط وى 0117م متعغصم 01 


1135-7 .مم :11 .701 :5165 أناع ط اا 


01 ع5نا عط]” .2005 ملاعملخ 8 لصه بكامعطم8 لك [١‏ عأتدابكلكى ‏ .16 
01217[7 تطاع 0ه 01 قستطعدعغ) عطا مذ ععصمل: معدم 0ه 012م1م» 
.411ب هناخ 01 دعصتلعءءه:2 ”عأطوهة 


لاعوطخ 8 2320 «تمتتقطد تاطخث 2 نؤامعءع1]806 لل عل[ .أنه [ تكلم .17 

مذ غأهطأقطت لله ناعع 0201035 .5نام01) 01 1756 عط1"” .2007 

01 دعطتلءءء210 ”ع تأطفعتط 01217 متمعغصمن 01 وسصتطعدءع1' عطا 
5 1155م 01 0102007 


5 6ط تلطع" .2005 الاءع اث 8 له مآ عتاته[تكلف ‏ .18 
35 01202005 01 5ع تتلءءء210 ”.ع أطا هل 01:17 7ططع مه 01 


115 


#28 1.6215 عأتطومة' .2012 .لاعونث 8 لصد كح كتلط .19 
01 5عتتتلععءء20 .181015 ع منلم0 01 إتاممصمعة1' ل :علق ) 
1ك ا ععطع 0211 نام لط0 20221 تاعاس1 2012 منن]1 

ع1 


ل :71 115م001) اعتتدع.[ عتطوعة ' .20139 اعوط 8 مدخ .كتك[ف .20 
95 .16562101 1218511385 ع1ط10ظ 101 عع 1ناموع8 الآ 
5 نآ 115م001) عتأطدتظ جه ممطايكا:ه 117 20مءعء5 401:2 117 1ه 


:05 1.6311 عتطوتة"' .20136 .ل1اعوطة 8 امد ذخ علتكاىثط .21 
01 كع8تقطتلءءع20 ”"غأممطنه 181165 220 <امتاأمتهكقطة؟]' ماع 1' 
-ذآ 012115 01 ععطع1ء021ر) 1216112210121 001201452013 


20105 


من 


مك 220 عصتطاءتهء5 101 5آهه1" .20142 لاعاخ 8 لصدخ كته 1[ف 
5 .561107 1552111201011 21 :012م001) عتط هق ع طذة217 
-كتتاعطاآ لعناممظ 101 هدك 0ودى طؤ1 811 2014 112)-آفضنفظ 
ماع11 لعنتاممك ووء؟2 #رأذوتاع لصنلا عع#10طمصدب اسه دعلا 

1170112 


عأطهتة عط 1ه مهن طه7ت سف" .2014 .لاعوطة 8 مدخ ؛كتدكاطة 
-قظة هع تعمطظ 1:2014 خط ]0 وعصتلععء2:0 .72 أعووها 1مك 


515 نا نآ كتام 01 101 مم50 


شاع تام دده .2015 عتنظ ااعوطى لصه طمالستلطق .كتاف 
سا عأطوعة ع مادام صصك :10 01ه1' بعل لل م )ام سمط تمعرظ 
اع 1 -31211317[ 31 بععطاع 1 طهر دخطع 5610 521101 طلا8 عط1' .101 

1 02002]آ :2015 111317 


-210ى 1101 .2013 .72تاععلمطتاطة © له ملاءع اخ 8 على كتهك[ف 
غ185 181101 اكع[ لل :ونام 001 اعصهدع.]آ عتطوعة عغطا أه متكه 
701 .117 عط مز عع 11201160 220 2106551125 1211511286 

.61 1185م5 .14-22.م2 


تعطتوع[ عتطدعف' .2014 .0272ع27 1 لطة مالاعوطة 8 عذة كتكلة 
01 15ام001) تاعكاوم5 20طة طع 1171 علا ل :72 كلظ ) كنام 1ه 
لتعطتدع[ 541172014نس[ 01 وعصتلءءء2:0 .5ع مدعا عتطوهم 

1 عط 0ه حأمخ صا و5016 15ام1ه 


8 م1 مصطاتنمع لم عصنصة/1 2 1ه امتدع تاممة' .2012 .1 تلذظ 
وك 01 56107 25 لل :كتام001) أجدء 1 2 طلا ماع22 ااعناوء 181 
2205 متطتاعع طاعطظ عنه50157 01 0111221[ لهطم لام متعام] علط 


2.127-4م :(701.6)3 .1025اهع نامممف 
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1ه كع م5 ١]‏ 0ه .1111120 11 مقطجةأئن]3 ن عد طاعصمتنو[ىة ‏ .28 
:5 005 عصتاءعغعل 101 [ع7200 عتتاعمده 5671 .قستصامء 
عتاكتتاعوصنط له تإتدععااا ".كاءعا عنصهة 01 101 077ناأة عمق م 


012 عنام 12م 


مئنوعل عط1" .2013 ملاعونة 8 لطهة سمسلهك-لخ كح .3 .طمتطوعاة ‏ .29 
وطن خرن ناكا 170105 دمتللتحمط 50 عط 1ه ممصم له 

]0 تع طتلعءء20 ”.عاطوعك 12551621ن) 01 كنام 01 1177و1ء217ل] 53110 
15 5م001 عأطوتتة نه ممطيعازه 117 0امءء5 2 1ق 117 


راع اع طلم 8 لصه مالاءعومخ 8 صمدسلوكلى ىح :81 عطمتطوعاى ‏ .30 
21501121 عتطهوعى عستزتمام:8 10 وع]1 ى بذنن 15171 .20142 
انآ 2021 تمده 4ه لأمطتناه[ 20221 طمعغم] ".دعاك 1 بعصا 


.2.27-6م :5 .701 .5ع 1ا5لناع 


لاءعوطة 8 2320 تصمسلوك لمق لك بطتوعاعطلف 8 .31 عطمتطوعاى ‏ .31 
00 823560 تا 121017 عط1]' 0 561077 121 1أمصصظ صخ ' .2014 
01 0111231[ 200521 2طعا0] ".نم00 عتطوعة لمع أو5د[ن عع21آ ىل 


.1-13.مم :5 .701 عوع 1 تناع طاءآ 2021غتاممام 


-01© 10 162611165 165أوتتاع مآ .2013 .لاع اخ 8 مد 5 للتمطء[لىم ‏ .32 
01 5م تتتلععع210 .00122 عط كه تتعلضه لمعتعه1مصمعطك عغطا معط 
11 15ام001) عتأطهتتة ده ممطكازه 1177 0زمءء5 1:2كم 117 


5 112101231 محطهن" .2014 .لاعواة 8 لصه 5 بتلتمطءع[ة ‏ .33 
اع11-1.[ آه دع صنلءءء210 .010122 عط 01 عطأعع ها عتاأمهمصاء: 101 
101 8521113101 2120 عع50111عظ]1 ع21281128:آ 2ه «زإمطايع!:01 117 20 :2 


.5 "1 0115 ذه ناع] 


اوذن 


-221 علطتار) التخمعل1 مغ ومنسنا/ط اع '1' عصنونا' .2012 .81 «لتتصاة 
-عط1' للطط ".كتام 001 ختاممع] وآ عمستهه عتطوحط ماما قمع 
.171517 110211010 ع2آ دزو 


حطع طول [ لطه :101221' لم :51طتاه1' ب[ .هملء< 2 :11 خم 
01 دعتتلعءء2:0 عتأطوعة :10 وصتلقه:؟2 لمعتعة' .2011 .طختطة 
تعن ]215 عطا طا توقطمهئعمءن2ع.آ عتدمماءع81 2011 ععاء 


كل له قطلدصحكهد5 2/1 .دععله0آ >1 عو امعتظ ب .8 ااعماة 
-15 220 عأطهتى م طاعدهن1امجط ععدعع 1الاعام] لمع قتاتتن سف .2011 
1 5 5ع تتلععء210 ”.اع طنمعغاص] عطا ده أمعغممن عندسها 
-ن1 :57220511112 رو 0[مصطءعء 1 هممص ممكمآ1 لهدمقدلط 310 

ل 


[ تطاععطدة تتاممدجع] !آل ممستلا رآ عتما 0 علمطوعكة [ .8 مااعملام 
عط دعأ صنحطدهل لامتاعصظ طعنط87؟' .2007 .ااعغطدة11 [ له بعصة117 
01 5ع طتلعءء210 #صدعتتع تلط نه لامتغترظ ,حاء 137 ع11710 117010 

115 5نام 01 0102007 


ناطكة 8 تتام[ 8 بطموطد8 ١]‏ كدمقطد لك بدعكالناد[ >1 .8 .1اعماة 
.181-20 1/1 320 متصمنامطاعدت 117 بتجتعصطء/ة لل تدتنتقطاد 
عقطع[لقطن 01220 اعد 2 بطهعنن0 عط عسنلصهاومع ل0 مل" 
دتوطنلءععء 260 ".ععمعع نلاعاه] لم قنمة امه ععمعق5 تع اسمن 
2ن مط 20 طنذ دعق 2ع 1لقطان 01220 000102010 01 


له عتطوعمة"' .2009 2متقطذ 5 لصهة عتكتهلا مكلف نآ :8 عالاعمطة 
9 08 5عوصنالعءءء2:0 .1170110 طوعة عطا صا امتاوصظ طوعة 
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.7 تاطث 8 220 عتستدو0 لق 5 عتكته[نك-لخ [ .8 ملاعونطةف ‏ .40 
-0ععع250 .10015 22217515 115م1م0ء عتطوهم 01 7اتعتتع2 لل .2004 
5 165 012210116غتالل أتاعماءنه11' :2004 11ل ]' 01 دعصا 


تأت لاع 


ل .111211ك-لل بآ :512531 تاطة 8 بمدططك آل .8 لاعوطى ‏ .41 

ده له منتعأمدظ 111001 عسامم د81" .2008 .طلهمكة5 131 له 

طون :8 81151/11852008 01 وعصتلعءء20 .01235م0125آ سممعتطمة 
5 متتعاأامد8 1/1001 :10 جاع50 


- ق كع كنطنآا صا ع1ده117 غد عع01716»0]' .1993 رلع) .8 ملاعوطةف ‏ .42 

تعطع ناآ عطلا 1ه ععمع عدم [قتتصصة لطامعنه؟ عطلا 4ه وعوصتلعءءءه2 

لطع 23560 ع1120171608 ولك نام عستلصنظ ممنغهعس 80 
15117ء217ن] ملعع.آ .مم146 .خخ لم1 


لقنتصطة]8 غءء(220 قصنوعة!' كتام2همت 108[ .1982 .28 ملاعوطف ‏ .43 
-2/100 220 دعنازتتاعطاآ 01 أتاعمستتدمء0آ1 ك1ه0ط0صدآط غتلءئؤومط 
.]21225[ 01 اأوتاع كنآ يعم تتاقصهاآ امتاعقصظ ص 


5 2235646 1001716086 2181035 عغط1" .1993 .8 ملاعوطف ‏ 442 
01 2102[ تصن له ععمعع نالاعغص1] لمع ماع :1580م ”.ع تتتهتاتم]1 
29-4.مم :83 .701 :01131119 ناه تتقطع8 


حءءءم 721-01-5 :101 قأء5 1285 01 اع 2م ه10ء7ه10' .2008 .8 لاءعوطة ‏ .45 

حك :5125 1نا118آ 115ام01) (.0ع) 1/1 مأتوا بذ عطناء110آ ".قطنوعها 

.501-526.مم :1 عصداه7 ع1[ههطلصدط لمصم له صمعام]1 
011771 ع0 


-1220 لتتة رعه[مصطءع[1' موعل8 عستكته امود" .2011 .8 ملاعوطة ‏ .46 
تت 1" نعط داور “.5ع كتاعط 2101156 1' وطتاءعاء1[0 101 12101 


2 


6 


011121 عط 01 561037 عنه[1تمتده0121-1 صق ' .2014 ىل عا متسصدظ 


|1011 


- 20015182 :850021 .2004 .تصتلتفصعءظ 5 لصه 1/1 تممعدظ 
01 وقطتلءعءء2:0 *.طء17 عط 1022 خحطتءا له 012م1مء قطام 
-0021 202 لة187 220 5عع50111ع1 ع13251138 2004 :1.1158 


6212. 


502ل1ع لتك [ لطهة ملصه[وحم8 ن مالاعمطة 8 بن بتو اتعترظ 
01 دعتاعتته7؟ 01 121122605ائ171 810171 2 :وتجهاكطلهةط عتاممممءة' 
ا مدهب 220221زعام]1 عط 01 لمضهناه[ز طلللفن]1 ".امتاعومظ 

.5-6.م2 :37 .701 ملامتاعطظ طتتعل1/10 01 عحتطاء هم 


500277 .20123 مالاعوطة 8 له قطلموحكة5 3/1 عن عو امعلمرظ 
-عنلعء:2 علدع81 عممقطط عتطه 1ل 101 كنام001) ه0131 01260 طم 
لعتاممك لماعتته7-17ع101 1174052012 01 وعصتلءءء2:0 :.0ملا 

.1 1م001 


ع501012-طء م0 .20121 .لاعطة 8 لطهة ممطتدمكة5 3/1 عن عو امعلرظ 
-قةا لطنة طاعععم5 عتطدعةف 101 كتام12مء غ02 ته نهل صتامط 
1251138 111802012 01 وقطتلءءء210 .م طذأووءء10م 286لا 


1650111265 220 17111210121. 


.2012 لاعرونة 8 لطه مقطلهمحدك 3/1 عن عو امعلرظ 
-210 .012م001) طاأعععم5 عتطوعةى لطهة لامتاعوصظ طذ :ج500ه:5 1ه 
101 2005غأ21 7151121 طا وععطهىلك4 17111:2012ك 1ه ملصتلءع 


115 


حطام؟ لاعمطة 8 لصه .00 هلاعوعط 8 بمطلدوحكهد 31 عن عو امعلرظ 
-122) عتطهتى 101 عطاممدحط خطآ- تطدحخ لعطلتمء ذل .عستطامء 
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-10] 0 ع1 عتطهننا0 بإ لعمطنتمكصا رع 10مصطاععا متامته5 
011121[ ".كع اع طهطم متتعلممط لصة .دع تاأمتسع صن عتطوعة لأهدم نئل 


ع أتمطء5 01 


مة' .1989 عععد2 11 لصه نماترهة1' 0 ملاعوطخ 8 على غاعءاءه:8 2 .54 
-210 .561106125 101 ماع 5775 5105521597 220 002356 أجزعا عاط 1م 
عأطهتق طذ عصنانامحدهن لماع سصتلزظ ده تتمستممع5 عط ؤأه وعصتلءع 

وك 


-50120126 5 عاع10 ممق معأ للم امقططه[ 0 ااعولة 8 :5 .102250 .55 

[ مطفتككة1' ن بطملصطة2 0 خأتنطط بآ أتنكط ‏ علممصسلظ ع1 صبدا 

-تأط همعد خش .2013 .191155000 8 لتته متعرول 5 .موعغ]8 5 امء8 

-222177 21101223 101 كنام 01 577م10اه لدطنء7 2160 مصصة توللهء 

0م10 عط 01 1[متطتتاه[ 1لفن] '.طتمعل 01 عكتتيء 01 ذ15زو 

701 امتاعصظ لوععتلءع/17 ممه حتعله8 1ه عحتطعمى تع امسامن 
37-9.م2 :37 


ماع17 220021ا[نامط هج :طللشاآ' .2012 ملاعونخ 8 لمه ك]آ .وعكلن1 .56 
5 .22217515 عتاأكتناعطنا عتكتته02طد1امء 101 عم هام 
-0012161) 121012لة877 220 5عع:11850111 122511286 2012 1:11:00 01 


6212. 


0 انع 1ع1010آ1م 1/101 .2010 .اموطدط آل لصة عا .وعك1ن101 .57 
5 11182010 01 وعصتلءءء2:0 '.عأطهتة عتصهة01 01 


1250111265 20 7111210131 


علطدداعع:11' ممع لمعمء10 قة' .2010 .تعالهسصاعنظ 1 لص ]ا .وعع1011 .58 
-0عع20 .121231 عتطهتة لهط 1120160 15128 ه02 عطلا 1ه 
.5 21001 12101122165 غ7 111052010 01 وعط1 


يوحن 


-10]8قل عتاع ه572 .2010 .2121ط5 ل له ااعكاة 8 1 .وعكانانآ 
-عع11' تإعطعلمعءمء2آ عتطوعة عتصهنتنا0 عطا 1ه1 وعسصنتاع 010 مما 
224 5عع16250111 122811286 1.111002010آ 01 وقطتلءءء210 ”علصهةط 


110112101 2 


آمء 6171560م1اك' .2013 نمطم 8 مضه مالاعممى 8 >1 .وععلنا[ 
".عتطهتى عتطهة1ا0 01 2متأمأمططة عتأعمامرة 102 ممتكخهمطج1 
-22.33 :17 .7701 .0111221[ 821112601 220 5عع1]1850111 121511286 

62 


أل مطتاطعة عط مذ دعنا155 دعم 0" .2013 .تلخ ذخ له :5 رجدناء 11-8 
5 .56107 عققء لل :12019 5021 عتطوعظ 1ه 22317515 


01 1112013 12120121015 1 12101122101 1 120107. 


585 .1801560121185 1802 ب :لتك 15اتا1 1 :31 ١زدط‏ حاط 
عطاع12 :قع12281128 0عع50111ع1-1ع110 101 5عع150111 132811286 
-ع1 عم تتاعطهآ ععتلطهتخث طأم؟ 5أمعستعءيت ممه .وعزع0616ه0 


اهز 85211120 220 5عع50111 


01 طامعتتع.][ لل .2010 .كتهل1 .1/1 تعترد8 له .5 أع 0115ل" “ممستماظط 
-تصومعءع8] عع 1" لدعتخام0 عتطوتى 101 كأطعططاومحطه0 لعاعءع مم0 
عتطدعة صذ وتع ممع[ ده ممطكعاره1177 00021 همنعام] أسزظ «ممل 


التاططةغ15 .2010 أذناع ناك 22 :2ه “انمع معع] 1105ل م11 


انمدلتها-لكى بآ له عتطاء ءتعسلم 8 ممتطداة 5 على 81201 
101 21210153 عصتصتدعآ-مط هنلعصست مك8 2 :مغسلاءتطوعمة 
5 .17ة[تاطوء10 لطة وعستلاعم5 عنتطومىة عصتصحهدعآ 
عل / زه ععطعنءع دهن هدم أممطعم1 1011052012 1ه 

001111111185 2114 5. 
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-15تا8 50101112 0ع115-525م 001" .2014 .83107 [ لطة 8 علممنوتظ .65 
.01605 ".قأخطع 5610 101 011106 لل :دعن 


-128 221 صتمصومع 10«طتقط هق ' .1997 .طغتحدد !]لظ سه 8 .ع510:ه 02‏ .66 
2112177 ل لطة طاعععا © :1 .ع1510ه02 طذ -754لكشلآن جاعع 
111011121013 عتاأكتتاعطااآ :2002م صصطك كتام1من (.قلع) 


-102 .22 :101001 :1011811211 01:3.5م001) اعد '1' تتع نا ملام 


-125 210122121تاع ع1 مامامة' .1971 .صتطت8 © لد 8 عمعع: 9‏ .67 
-115ا1125آ 01 7م10 اأتاممع؟ لمعتصطءع 1 ' ".امتاعم8 01 قمع 


111 810170 5ع 


عط مذ وعاتاعع طهر" .2010 .لاعونة 8 00د .22110آ ١1‏ :11 بمدومه .68 
20خ 08 دع صنالءءء2:0 .115م2م0ء عأطوعة ع11710 11ه 117 
كام 001 لع تامدك لمأعتنه ا ع م1 


عط مذ دع كتاءع صدمن' .2013 .لاعوطظة 8 له .102110 ١‏ .11 دونو .69 
وععطعك5 لع نامك 11701104 ".تام نمه عتطهتتخ حاء117 ع11710 1170110 
224 عقصنطعةء 1 ع2281128آ صا دعن510 01 عناد5] [دأععم5) لمصهتاه[ 


22.67 :21 .701 :8 لنطتتوع.]1 
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قواعد المبانات الالكترونية للمخطوطات الترائية العربية والإسلامية؛ 
الحاضر والمستقبل 


د. سامح عويضة ” 


5.25121012)0( 0|102 


#) أستاذ مساعدخ قسم هندسةالحاسوب 4# جامعة القصيم المملكة العربية السعودية. حصل 
على درجة الدكتوراة 4 هندسة وعلوم الحاسب الآلي من جامعة الملك فهد للبترول والمعادن» 
والبكالوريوسس والماجستير 4 الهندسة الكهربائية من جامعة هارتفورد,؛ الولايات المتحدة 
الأمريكية. 4 السابق عمل محاضرًا 4 جامعة الملك فهد وجامعة الأميرة سمية. تشمل اهتماماته 
البحثية التعرف على الأنماط ومعالجة الصور والاًنظمة المدمجة. بالإضافة إلى اثنتين من 
براءات الاختراع العالمية» نشر أكثر من خمسة عشر بحثًا علميًا ‏ مجلات ومؤتمرات دولية. 


5 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


ملخص 


إِنْ المشتفل بالتراث العربي والإسلامي يلاحظ نقصًا واسعًا 4 جهود رقمنة 
المخطوطات,. وندرة 4 الاستفادة من البرمجيات والخوارزميات الحاسوبية ذات 
العلاقة بمعالجة الوثائق التراثية؛ على النقيض من مدى استفادة العلوم الإنسانية 
عند الغرب لهذه التقنية. يذكر الباحث 4 هذا المقال واقع رقمنة الوثائق التراثية 
من قواعد البيانات الإلكترونية لفهارس المخطوطات. وقواعد المخطوطات الرقمية: 
مع ذكر أبرز المزايا والعيوب. كما يقترح المواصفات المناسبة لبناء قاعدة بيانات 
متنوعة الصور للمخطوطات العربية والإسلامية الممسوحة ضوئياء مع تحديد 
المتطلبات التي تمكن قاعدة البيانات المقترحة من خدمة باحثي العلوم الإسلامية 
وعلوم الحاسب الآلي ممًّا. تم تنظيم قاعدة البيانات الإلكترونية المقترحة 
للمخطوطات التراثية لتقوم وفق مهام محدّدة مسبقًا تساعد # تطوير البرمجيات 
الخاصّة بباحثي الحاسب الآلي: وتمكينهم من خدمة التراث العربي والإسلامي؛ 
والتي منها - على سبيل المثال - التعرف على الكتابة آليئاء والبحث عن صور الكلمات 
دون تعرفء وتحليل صور الوثائق: والتعرف على الناسخ والتحقق منه. وغيرها من 
مستجدات البحث العلمي. 


54 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


١‏ مقدمهة 
إن العناية بتراث علمائنا السابقين؛ بحفظ أصول كتبهم الخطية من الواجبات 
الكفائية: ويشمل ذلك إيقاف طلبة العلم النبهاء عليه ا واستخدام الوسائل 
العصرية التي توسع نطاق ذلك وتذلل عقباته. كالبرامج الحديثة التي تعين على 

الوقوف على المعلومات بأسرع وقتء وعلى وجه فيه دقة [1]. 


ويقدر عدد المخطوطات العربية والإسلامية اليوم بثلاثة ملايين مخطوطة. 
تتطرق العربية منها إلى موضوعات شتّىء إذ تتسع دائرة عناوينها لتشمل كافة 
مجالات العلوم الإنسانية تقريبّاء بينما تحتوي المخطوطات الإسلامية على نصوص 
بعدّة لفات - إضافةً إلى اللّفة العربية - كالفارسية والتركية العثمانية والأوزبكيّة 
ومٌدة لغات أخرى. هذاء وتوجد مجموعة ضخمة من المخطوطات والوثائق 
الإسلامية والتاريخية # المكتبات والمتاحف العالمية يجري حاليا مسحها وتخزينها 
رقميًا - لأغراض الحفظ وتيسير الحصول عليها من قبل الباحثين والمهتمين ب 
جميع أنحاء العالم - من خلال المكتبات الرقمية المتوفرة على الشبكة العنكبوتية 
الإلكترونية (الإنترنت). لآ كانت المخطوطات الأصلية بين يدي الباحثين ولا سيما 
مجاميع المخطوطات,. كانوا على مقدرة من معرفة عمر المخطوط بنوع الورق 
والحبرء وتحديد اسم الناسخ الذي يكون مسجَّلًا ب آخر المجموع غالبّاء فلمًا توزعت 
رسائل المجموع بالتصوير الضوئي فقدنا أسماء الناسخ # عدد من الرسائل ما عدا 
الأخيرة من المجموع؛ مما يدعو إلى الحاجة إلى استخدام التقنية # التعرف على 
ناسخي هذه الرسائل. 


المخفية خ مكتباتنا. وقد اهتمٌّ حافظي زهير 4# مقاله ' دور تكنولوجيا المعلومات 
حفظ المخطوطات العربية" [؟] بذكر بعض التجارب الرائدة ‏ استخدام 


الا 


النظم الآلية 4 معالجة المخطوطات العربية وإتاحتهاء مع ذكر متطلبات رقمنة 
المخطوطات وخصوصياتها ومواصفاتها. ومع هذه الجهود المباركة: فإِنْ مجرد 
عرض صور من المخطوطة لا يعد كافيّاء لآنْ الصور غير قادرة على نقل العديد من 
التعواشت الياقة الجكمل زفي هذ (افووطوف] تنماوفله روسفه ررق وتات 
ومحتوى الصورء والكتابة والخطء وذكر تاريخ ومكان كتابة المخطوط بفهرس قابل 
للبحث فيه؛ وغيرها من المعلومات الهامّة. لذاء فينبغي ألا يكون الهدف الرئيسي 
من رقمنة الوثائق التراثية مقتصرًا على توفير صور المخطوطات والوثائق فحسب» 
ولكن على توفير وصف لمحتوى المخطوطات يتميز بالدقة والشمولية؛ وكذلك على 
توفير نصوص المخطوطات لكي يتنسى للباحثين # المستقبل البحث 4# صور 
المخطوطات بسهولة ويسرء والعمل على توفير الترجمة ( الآلية) لهذه النصوص 
لتذليل العلوم الإسلامية والعربية لسكان العالم أجمع. 


نظرًا للتطورات الأخيرة ع علوم الحاسب الآلي: وخاصّة علم التعرف على 
الأنماط (2ه10مع م16 درم )د ) : فقد أصبح من الممكن لهذه العلوم خدمة 
باحثي التراث العربي والإسلامي بصورة كبيرة. نذكر تاليا أهمٌ هذه العلوم وطرق 
إفادتها لباحثي العلوم الإنسانية: ّ 


أ. التعرف على النصوص المكتوبة آئيًا (دماتمومءعع< ع1 عتأهسماتة ) : 
إلكتروني مما يتيح البحث فيه:؛ والتعديل عليه؛ وطباعته ونشره إلكترونيًا ضمن 
عدد من العمليات المفيدة. ولا شك أن برمجيات التعرف على النص المكتوب آليا 
مدن أككر الأمون] نت شيب لباحشيو بك لعلو الإنسانية ذا سك ودي ادم عملية 
النسخ والتفريغ اليدوي للمخطوط التي قد تستغرق الأيام أو الأشهر والسنين. وهي 
ميزة تفوق الوصف # تيسير علم البحث 2# المخطوطات. ولك أن تتصور كم 2 هذا 


من تذليل للعلوم إن توفر البحث 2# قاعدة بيانات تضم عددًا ضخمًا من الصور 
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آليّاء وخاصّةٌ إن استطاعت هذه العملية الآلية التفوق على نتائج التفريغ اليدوي ب 
الدفّة. وممًا تعتمد عليه نتائج هذه البرمجيات #2 نجاحها دقة نتائج برمجيات 


أخرىء مثل تحليل صور الوثائق ومعالجة اللغة الطبيعية. 


ب. البحث عن صور الكلمات (0]108م5 110120) : 

كشيرًا ما يحتاج الباحثون # العلوم الإنسانية إلى البحث عن كلمة أو جملة 
محددة# المخطوط دون معرفة نص المخطوط بأكمله؛ أي دون أن تضطرّهم 
لقراءة المخطوط بأكمله أو التعرف على نصه آليّا للبحث عمًا يحتاجون. ولتطبيق 
هذه العملية نستخدم صورًا للكلمة أو الجملة المراد البحث عنها ونستخدم برمجيات 
علم التعرف على الأنماط للبحث عنها وتحديد مكانها ب المخطوط. 


ج. تحليل صور الوثشائق (17:515[دمى 12286 أمعصسداء120) : 

يهدف علم تحليل صور الوثائق إلى تحليل صور المخطوطات التراثية ووصف 
هذه الصور للمساعدة 4# علوم أخرى. فعلى سبيل المثال؛ تستطيع برمجيات تحليل 
صور الوثائق التعرف على مواقع الفقرات الكتابية # الصفحة وتحديد إحداثيات 
محيط هذه الفقراتء كما تقوم بتقسيم الفقرات إلى أسطر منفردة لتجهيزها 
للتعرف الآلي على الكتابة:؛ بالإضافة إلى تحديد الرسومات (مثل الأختام أو 
الأشكال) ‏ صور الصفحات مع وصفها وصمًا مفيدًاء والكثير من الأمور الأخرى 
التي تساعد برمجيات التعرف على الأنماط. 

د. معالجة اللغة الطبيعية ( 2500655108 382811286.آ 213601121 ) : 

يستخدم علم معالجة اللفة الطبيعية قواعد اللفة العربية ونتائج التحليل 
الإحصائي للنصوص الإسلامية 4 تمكين أجهزة الحاسب الآلي من فهم نصوص 
الوثائق التراثية واستكشاف العلاقات والأنماط المفيدة: وهو من العلوم المساعدة 
المهمّة 4# علم التعرف على الأنماط. فعلى سبيل الكاله مسد برمجيات معالجة 
اللغة الطبيعية © تحسين دقّة نتائج التعرف على الكتابة آليًا. 


يف 


ه. التعرف على الناسخ والتحقق منه (200 52216100 مع10 1171161 
ع 11 ) : 

تعنى عملية التعرف على الناسخ أو الخاط بتحديده آليّا من مجموعة من 
النشاخ من خلال تحليل عينات من صور خطوطهم ضمن قاعدة بيانات لخطوط 
النسّاخ. كما تعني عملية التحقق من الناسخ التأكيد الآلي لصحة نسبة المخطوط 
لناسخ معّين من خلال مقارنتها مع عينات سابقة لصور خطه. مما قد يعطي قيمة 
علمية للمخطوط كأن يكون الناسخ ممن تمرف بفن معين فيسهل على الباحث 
التعامل مع المخطوط # فهم النص وتوجيه عبارته من خلال ما عرف من منهج 
الناسخيك# منسوخاته أو منهج المؤلف 4# مؤلفاته السابقة؛ وتزيد أهمية هذا البند 
الاهتداء لاسم الناسخ أو المؤلف فيما عُثر عليه من مخطوطات ناقصة الأول 
والآخر؛ فيتم التعرف عليه من خلال وجود قاعدة ضخمة من صور المخطوطات - 
التي عرف اسم ناسخها أو مؤلفها - تعرض على إثر بعضها فيظهر اسم الناسخ 
او المؤلفء وقد يهتم هذا العلم - بدلا من تحديد اسم الناسخ - بتحديد عصر 
أوقرن المخطوطء أونوع الخط المستخدم 2# الكتابة: مما يساعد # تثمين قيمة 
المخطوطات الأثرية وكشف المزيف منها. 

إِنْ أحدث التقنيات حاليًا لا يمكنها التعامل مع المخطوطات والوثائق التاريخية 
البحث عن النصوصء أو معرفة المحتوى: فضللا عن ترجمته بصورة ناجحة. لذا 
فلا بد من بناء قاعدة بيانات رقمية ضخمة للباحثين تحتوي على الوصف المناسب 
لكل مخطوط بالإضافة إلى نصوص المخطوط. مع تجهيز الأدوات المناسبة للباحثين 
4 مجال علوم الحاسب الآلي والتي تساعدهم 4# بناء البرمجيات الخاصة بالبحث 
والتحليل والترجمة والتعرف على الأنماط آليًا. 


نقوم بتقسيم ما تبقى من هذا المقال على النحو التالي؛ نناقش 4# الفصل 
الشاني واقع فهارس المخطوطات الرقمية مع ذكر أبرز المؤلفات والمواقع المعنية 
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بفهارس المخطوطات العربية والإسلامية»: كما نخصص الفصل الثالث لذكر جهود 
الباحثين والمؤسسات 2# قواعد بيانات المخطوطات الرقمية؛ مع إيراد أبرز هذه 
القواعد وميزاتها وعيوبها. ونذكر يك الفصل الرابع الجهود المبذولة 4 محاولة 
جمع قواعد بيانات خاصّة بخطوط العلماء السابقين وناسخي المخطوطات, ثم 
نقدم كك الفصل الخامس مقترحًا لمواصفات قاعدة بيانات مستقبلية للمخطوطات 
الإسلامية والعربية وعرضها بالتقنية الرقمية. مع الخيارات والميزات التي تمكن 
قاعدة البيانات المقترحة من خدمة باحثي العلوم الإسلامية وعلوم الحاسب الآلي 
معّاء وأخيرًاء يتم عرض النتائج والتوصيات 4# الخاتمة ب الفصل السادس. 
"- فهارس المخطوطات الرقمية 

د فو كور ينه تفظو كناك لم قا فيا ك3 ]مده :| ذيفنت كفي قوعلا 
وتوثيقهاء ثم تسجيلها # قوائم: أو بطاقات: أو كتب لحفظها. فيقوم المفهرس 
بوضع كل ما يتعلق بالمخطوط من معلومات 2# هذه الفهارمس:؛ كعنوان المخطوط. 
واسم المؤلف. واسم الناسخ: وتاريخ النسخ؛ وعدد الأوراق؛ وعدد السطور كذ كل 
صفحة؛ وحجم الورقء ونوع الورق» ونوع الحبر؛ وحال المخطوط. كما أنه يضع 
اقتباسًا من بداية المخطوط ونهايته؛ وغير ذلك من أوصاف يراها المفهرس. وهي 
تختلف من مكتبة إلى أخرى. وقد ذكر صلاح الدين المنجد © كتابه '"قواعد فهرسة 
المخطوطات العربية" [؟] تاريخ فهرسة المخطوطات العربية والإسلامية؛ بالإضافة 
إلى بعض القواعد والأساليب المستخدمة 4 فهرسة المخطوطات. 


ومع عدم توفر مصادر رسمية لعدد فهارس المخطوطات 2# العالم؛ إلا إنّه 
ييعتتنا ديز عروها بالألاف: يلاقد يضمل انن عشترات الذلاف» يدلبل أن مؤسسة 
الفرقان جمعت 2# كتابها 'المخطوطات الإسلامية # العالم' ما يزيد على خمسة 
عشر ألف فهر سس للمخطوطات الإسلامية [4]. كذلك الفهارس التي جمعتها 
مؤسسة آل البيت للفكر الإسلامي 4# فهرسها الشامل وصلت إلى ألف وستمائة 


7“ 


00100 


جهود الباحثين المنشورة 4 جمع فهارس المخطوطات العربية والإسلامية 

تزخر المكتبات بمخطوطات التراث العربي والإسلامي 4 مختلف بقاع العالم, 
يذاه كف اها حكؤون :دولة موسةه لوو الا وتموفها فهويا د عكر تخطوطات 
مكتباتها. إِمّا باللفة العربية وما بلغة الدولة الأم. وقد قام الباحثون على مدى 
التاريخ بعدَّة محاولات لجمع هذه الفهارس؛ وذلك للتعريف بها وتسهيل عمل 
الباحثين والمهتمين بهذا العلم» نذكر على سبيل المثال كتاب "تاريخ الأدب العربي" 
[1] لمؤلفه المستشرق الألماني كارل بروكلمان: الذي صدر الجزء الأساسي منه بذ 
مجلدين عامي 1898 و7١15‏ ثم تلته المجلدات الثلاثة الكبيرة أعوام: 1951 و/117 
و1443 م. وقد يتصور الباحث للوهلة الأولى أنَّ هذه الموسوعة كتاب ‏ تاريخ الأدب. 
بينما هي # الحقيقة سجل للمصنفات العربية المخطوط منها والمطبوع. ومن هذه 
الجهود أيضًا كتاب ' تاريخ آداب اللغة العربية" لجورجي زيدان[7].و"تاريخ 
التراث العربي" لفؤاد سزكين [8] الذي طبع باللغة الألمانية. ثم تولت جامعة 
الإمام محمد بن سعود ترجمته إلى العربية؛ وصدر منه عشرة أجزاء. كما قام 
السيد رزق الطويل # كتابه "مقدمة # أصول البحث العلمي وتحقيق التراث" [9] 
بتكريس قسم منه لذكر فهارس المخطوطات الإسلامية. وبالجملة:؛ فإِنّ المؤلفات 2 
هذا الباب كشثيرة؛ وقد تصل إلى خمسين مؤلف وزيادة: نذكر # العناوين التالية 
أبرزها. ّ 
فهارس 'معهد المخطوطات العربية" 

يعد معهد المخطوطات العربية واحدًا من أقدم المراكز المعنيّة بالمخطوطات 
4 الوطن العربي. تأسس المعهد سنة ١445‏ وهوملحق بالمنظمة العربية للتربية 


كلا 
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والثقافة والعلوم مع تمتعه بشخصية معنوية مستقلة. يُعنى المعهد بالتراث العربي 
المخطوط بمختلف أصعدته؛ جممًاء وإتاحة؛ وصيانة؛ وترميمًاء وفهرسة؛ وتعريفًا 
ودراسة؛ وتوظيمًا. للمعهد عدد من الإصدارات المهتمة بفهارمس المخطوطات 
العربية: نذكر منها 'فهارسس المخطوطات العربية ‏ العالم" . و" دليل مكتبات 
المخطوطات # الوطن العربي' ؛ وعدد من فهارس المخطوطات # دول العالم مثل 
"فهرس مخطوطات جامعة الإسكندرية'" وغيرهاء بالإضافة إلى مؤلفات فيصل 
الحفيان - مدير معهد المخطوطات العربية -. 


ولا شك أنَّ من أهمّ مؤلفات المعهد '"فهرس المخطوطات المصّورة" [١٠1؛‏ وهو 
فهرس للمخطوطات المصورة 2# معهد المخطوطات العربية ومقسّم حسب الفن من 
تاريخ: وعلوم: وعارف عامّة. وسيرة نبوية. وأدب. وفقه. وحديث. وتفسير. وقد 
تمت طباعة هذا الفهرس على عدّة مراحل زمنية تجاوزت خمسة عقود من الزمن؛ 
إذ تم طباعة المجلد الأول .2# عام 1508 مء وثمٌّ طبع آخر مجلد عام ٠١١١‏ م. وممًا 
يعيب مطبوعات المركز الانقطاع الطويل # أعمالهم: وعدم الاستمرارية # الجهود 
المبذولة. كما أَنَّ المعهد من أوائل الذين تبنوا سياسة رقمنة المخطوطات والفهارس 
منذ عشرات السنين: ولكثنا لا نجد لهم برنامجًا متميرًا من إصداراتهم هذا 


وللفائدة؛ فقد نشر المعهد موقعًا باسم "خزانة المخطوطات" [١١].؛‏ يذكرون 
فيه القدرة على البحث الرقمي عن المخطوطات التابعة للمعهد. وهو قيد التعديل 
والتجريب منن فترة؛ ونتائجه غير مرضية. كما أَنْ موقع المعهد على الإنترنت مليء 
بالروابط التي لا تعمل والمعلومات الناقصة. 
"المخطوطات الاسلامية 2 العالم" لملؤسسة الفرقان 

قامت مؤسسة الفرقان للتراث الإسلامي [؟17١]‏ بعمل مسح وإحصاء شامل 
لمجموعات المخطوطات الإسلامية 4# أنحاء العالم شملت فهارس مئة وستة بلدان؛ 


8و 


ثم نشرت نتائج هذه الدراسة 4 كتاب '"المخطوطات الإسلامية خ العالم" بنسختيه 
الإنجليزية [؟١١]‏ والعربية [؛ ]. وتذكر الموسوعة دراسات حول عدد المخطوطات: 
واللغات التي كتبت بهاء كاللغة العربية والفارسية والتركية والأوردوية والسواحيلية؛ 
وأماكدق توائجه تلك الخظوظاك: كما عاولت الدواشة التجموغات الت مهرسف: 
وعناوين الفهارس التي تم نشرها.ء والتي لم تصدر بعد 4 تلك المكتبات: إضافة 
إلى ذكر بعض عناوين نوادر المخطوطات. وقد ذكرت مؤسسة الفرقان أنّها قامت 
بجمع هذا الكتاب مما يزيد على خمسة عشر ألف فهرس للمخطوطات الإسلامية. 
مع الإشارة إلى أن كتاب ' المخطوطات الإسلامية ك# العالم" هو أقرب لموسوعة 
تقوم بالتعريف بيمكتبات العالم التي تحتفظ بفهارسس للمخطوطات الإسلامية مع 
التعريف بهذه الفهارسء. من كونها مجموعًا لفهارس المخطوطات كما هو حال 
"فهارس آل البيت" التي نناقشها تاليا - مثلًا -. 


فهارس آل البيت 

ومن المشاريع المؤسسية المهتمة بحصر المخطوطات العربية الإسلامية استنادًا 
على الفهارس المطبوعة والمخطوطة للمكتبات العامة والخاصة؛ مشروع '"الفهرس 
الشامل للتراث العربي الإسلامي المخطوط" الذي سبقت الإشارة إليه؛ والمعروف 
باسم '"فهارس آل البيت" [0] إذ قامت بجمعه مؤسسة آل البيت للفكر الإسلامي, 
فخرجغ# خمسة وعشرين مجلد. وقد اعتمدت المؤسسة أذ تحقيق هذا العمل على 
ما جمعته من الفهارس والمصادر والدراسات المختصة التي جاوزت الألف وستمائة 
فهرمس للمخطوطات 4# سبع عشرة لفة. وقد قامت المؤسسة بطباعة المشروع 
على مراحل عدّة حسب الموضوع؛ فطبعت فهرس مخطوطات التفسير وعلومه ب 
مجلدين: وفهرسس المصاحف المخطوطة ومخطوطات رسم المصحف 2 مجلد: 
وفهرمس مخطوطات الحديث النبوي الشريف وعلومه ورجاله ف ثلاثة مجلدات. 
وفهرسس المخطوطات العربية ‏ مكتبة تشستربيتي © إيرلندا ‏ ثلاثة مجلدات, 
وفهرس مخطوطات التجويد #ش مجلد. وفهرس مخطوطات القراءات# مجلد, 


لل 
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وفهرس مخطوطات السيرة والمدائح النبوية 4 مجلدين:» وفهارس مخطوطات الفقه 
وأضنولة 3 اق عشرة مجلد: وم كتخامة عمل مؤسسة آل ألبيت ب فياوسهاء إلا 
لذ ايو نينا فك هله يكمل جديم النلوم بعت يل إله متوقف بجاليًا كه لمت من 
المؤسسة نفسهاء وآخر هذه المجلدات من الفهرس طبع قبل عشر سنين 2# عام ٠٠١5‏ 
م. ومن أبرز المآخذ على هذا الفهرس أنه لم يعتمد على مشاهدة المخطوطات التي 
تمت فهرستها؛ بل اقتصر على النقل من الفهارس الأخرى؛ مما أدى إلى استمرار 
فق الأكماء كتسيوة سكن الالخطوظ كران كير احتينا ينا حرود > عنما امل 
ما ذكر.ء# الفهارس الأخرى. 


وعلى الرغم من عدم فهرسة بعض المكتبات المخطوطاتها أو عدم نشر هذه 
الفهارمسء فإن الكثير من مكتبات العالم التي تحوي مخطوطات عربية وإسلامية 
صنعت فهرسًا ورقيا مطبومًا لهذه المخطوطات. لكنَّ ظاهرة رقمنة فهارس 
المخطوطات لا تزال محدودة جدًا؛ فالمكتبات ما زالت تعتمد على طباعة الفهارس 
ورقياء مما يجبر الباحثين على البحث اليدوي 4# هذه الفهارس. فيستهلك منهم 
الكثير من الوقت والجهد؛ عدا عن ندرة بعض هذه الفهارس المطبوعة لقدمها أو 
نفاد المطبوع منها. ولذا قام عدد من المؤسسات بمحاولة جمع هذه الفهارس ذ 
مطبوع موحد يسهل على المهتمين عملية البحث؛ وسنحاول 2# هذا القسم التعريف 
بأشهر فهارسس المخطوطات الرقمية. وبالرغم من نشر هذه المجاميع لفهارس 
المخطوطات:. فَإِنٌ خروج غالب هذه المحاولات بصورة ورقية لا يزال يشكل عائقًا 
:4 عملية البحث العلمي. 


الجمع اليدوي لفهارس المخطوطات 

من جهود رقمنة فهارس المخطوطات. قيام بعض المؤسسات والمواقع المهتمة 
بالتراث العربي والإسلامي بجمع فهارس المخطوطات المطبوعة ومسحها ضوئيًا 
ووضعها على صورة ملفات ( 2821 أو 18/050) على الشبكة الإلكترونية. ومع أنَّ 
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غالب هذه الملفات هي صور لصفحات هذه الفهارسء مما يعني عدم القدرة على 
البحث إلكترونيّ ا فيهاء إلا إِنَّ بعضها قد تم تفريغه إلى نصّن إلكتروني. إِمّا آليّا أو 
يدويًا أوآليّا قد تمت مراجعته يدويًا. إنَّ هذه الخطوات - وإن كانت أولية 4 رقمنة 
النيزارتن ك إله انها ميكة خاضة ف الغيارين الظنوعة القديمة وصرورية لركمتة 
فهارس المخطوطات كليّاء ولن تكون تامة حتى يتم تفريغها كلهاء وتدقيقها. ووضعها 
:ف قواستي وباقابة واتظينه ,ملهو هئ ييل اللقنا ل ههاؤين اللخطوظ اث جه ترق 
الإلكتروني ل" مركز ودود للفهارس وكتب التحقيق" [74]؛ وفهارس المخطوطات 
المجموعة 4 برنامج " المكتبة الشاملة" :]١5[‏ وموقع "جامع المخطوطات 
الإسلامية" [15]: وبعض المنتديات الإلكترونية المهتمة بالعلوم الشرعية .]١11[‏ 


قواعد فهارس المخطوطات الرقمية 

وبعد أن وقفنا على أهم الجهود 4# جمع فهارمس المخطوطات الإسلامية 
المطبوعة وتصويرها ضوئياء نذكر هنا قواعد فهارمس المخطوطات الرقمية. وهي 
خطوة أساسية # رقمنة المخطوطات, إذ تسمح هذه القواعد بالبحث 4 حقول 
بطاقة كل مخطوط على حدة؛ مثل اسم المؤلف وعنوان المخطوط وسنة النشر 
وغيرها من المعلومات: إلا إنَّ هذه الفهارس تفتقر عادة إلى خدمة تصفح صور 
المخطوطات أو تحميلها. 
مكتبة الفرقان الرقمية 

من هذه القواعد نجد مكتبة الفرقان الرقمية [17 ] إذ يسمح الموقع الإلكتروني 
بالبحث بذ المخطوطات. إلا إن واجهة البحث حاليًا تعمل باللفة الإنجليزية (يذكر 
الموقع أن الواجهة العربية تحت التطوير) ولا شك أنَّ الموقع بحاجة إلى إضافة الكثير 
من المخطوطات ليصبح مرجعًا معتبرًا 4 البحث الرقمي 4# فهارس المخطوطات, 
إذ يدك الموقم أله يحوي فهاريين :8 :ا #متخطوط] :رهد القدة ف ازديات يحو 
الموقع الكثير من الخيارات التي تمكن الباحثين من البحث حسب المؤلف, والموضوع, 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


والكفينة ولمه االخطوظوعيرها مت السيارات لفون ةك حاير نتافم البحه 
معلومات المخطوط بطريقة منظمة: مع فرز كل جزء من بطاقة المخطوط ( العنوان, 
اسم المؤلف, اسم الناسخ, 0 بحقل مثئفرد: مع إمكانية ربط بعض هذه الحقول 
إلكترونيّاء كما يظهر 4 رسم توضيحي .١‏ 
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رسم توضيحي :١‏ صورة توضيحية لنظام البحث لي مكتبة الفرقان الرقمية. 


م١‎ 


موقع يوسف زيدان الإلكتروني 

يقوم موقع يوسف زيدان الإلكتروني [14] بتوفير قاعدة بيانات لفهارس 
المخطوطات . ويتيح للمتصفح البحث فيهاء ويحوي هذا الموقع مجموعة قليلة من 
فهارمس المخطوطات العربية والإسلامية؛ وهي: فهرس مكتبة رفاعة الطهطاوي 
(قرابة 1٠١‏ مخطوطة) . وفهرس المخطوطات العلمية بمكتبة بلدية الإسكندرية 
(470 مخطوطة)؛ وفهرس مخطوطات شبين الكوم (١6؟‏ مخطوطة) ؛ وفهرس 
مخطوطات الفقه بمسجد أبى العبامس المرسى /٠١(‏ مخطوطة)؛ وظهرمس 
مخطوطات المعهد الديني بِسَمُوحَة ٠١4(‏ مخطوطة)؛ وفهرمس مخطوطات دار 
الكتب بطنطا (7غ؛ مخطوطة) . ويظهر رسم توضيحي ١‏ نظام البحث 4# فهارس 
المخطوطات # موقع يوسف زيدان. 


فهارس المكتبات الخطية 


إشاسة : 


يشتمل هذا الباب من الموقع » على فهارس وصفية كاملة لمكتبات خطية مهمة . 
ويمكن البحث فى محتوى هذا الباب » بكلمة من عنوان المخطوطة ء أو كلمة من اسم مؤلفها » 
أوكلمة من بدايتها أو موضوع المخطوطة أو رقم حفظها 


رسم توضيحي ؟: صورة توضيحية لنظام البحث 4 موقع يوسف زيدان. 
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"خزانة التراث"' لمركز الملك فيصل 

كما قام مركز الملك فيصل للبحوث والدراسات الإسلامية بالرياض 2# العام 
7 م بإنشاء قاعدة بيانات باسم "خزانة التراث" [19] تشتمل على فهارس 
المخطوطات الإسلامية 4 جميع المكتبات والخزانات ومراكز المخطوطات 2 
العالم» حتى بلغ عدد عناوين هذه المخطوطات أكثر من مائة وعشرين ألف. تتضمن 
خزانة التراث فهارس مخطوطات عربية وإسلامية من مختلف أنحاء العالم: 
بالإضافة إلى فهارس لمخطوطات مكتوبة بلغات أجنبية ترجمها المركز إلى العربية. 
كما يوفر البرنامج مداخل بحث متعددة يستطيع الباحث من خلالها الوصول إلى 
المعلومة التي يريدها بكل يسر وسهولة, مثل البحث يذ الفن؛ و عنوان المخطوط, 
والعنوان الفرعيء وك اسم المؤلف. واسم الشهرة:, وتاريخ الوفاة:» وقرن الوفاة, 
واسم المكتبة؛ واسم الدولة:» واسم المدينة؛ ورقم الحفظ. ويظهر رسم توضيحي 
#عْدٌّة ور لشاشات برنامج '" خزانة التزات .ومن أبسرز عيوب برتامع” خزانة 
كرك" + مخ تنو نه ميقا روغ له لابيمد ل إلا على نظام تشعيل الويعد وز عط 
وأنْه لم يتم تحديثه منذ سنين: مما يحدّ من استخدام البرنامج على أكثر الأجهزة 
الحديثة. 


الذذا 
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اسم المثقية_ إمركز الملك فيصمل للبحدث «النراسات الاسلابهة 
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رسم توضيحي ": عدّة صور توضيحية لشاشات برنامج "خزانة التراث'' 
"'خزانة الماجد للتراث" لمركز جمعة الماجد 

ومن البرامج المميزة ب فهارسس المخطوطات برنامج '"خزانة الماجد للتراث" 
[70] المصمم من قبل شركة الدار العربية لتقنية المعلومات للتعريف بمخطوطات 
مركز جمعة الماجد للثقافة والتراث والبحث فيها. يحوي البرنامج أشمل قاعدة 
بيانات إلكترونية لمخطوطات مركز جمعة الماجد. تذكر بطاقة المخطوط عنوان 
المخطوطة:؛ والعنوان البديل؛ والمؤلف, والناسخ؛ وبدايتها ونهايتهاء والملاحظات 
المتعلقة بالمخطوطة؛ وعدد الأوراق» واللغة؛ ويظهر رسم توضيحي ؛ مثالا لإحدى 
بطاقات المخطوطات # البرنامج. ويقدم البرنامج خدمة البحث عن أي مخطوطة 
وذلك بالإشارة إلى ما يراد البحث فيه من العنوان أو العنوان البديل أو بداية 
المخطوط أو نهايته أوعن طريق مؤلفه أو ناسخه أو جميع ما سبقء مما يتيح للباحث 
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سرعة الوصول للمخطوطة المطلوية. إلا إِنَّ هذا البرنامج كسابقه -برنامج '"خزانة 
الشبكة العنكبوتية العالمية مما يحد فعليًا من فائدته؛ لغياب التحديثات له. 


وم نلاحة 

لأص اث ١‏ 

ررق الوق 

:ئة] لات يلاحة العرية 


رسم توضيحي ؛ : صورة توضيحية لبطاقة مخطوط لذ برنامج " خزانة 
الماجد للتراث". 


فهارس مخطوطات مكتبة المسجد التنبوي 

وَمق الجوهالحريكه ف زقسة كا رسن الخطوظاف عوسود'الزكاسة الجاتة 
لشؤون المسجد الحرام والمسجد النبويء, إذ قاموا برقمنة فهارس مخطوطات مكتبة 
الممسجد النبوي وتوفيرها للباحثين على شبكة الإنترنت [١؟‏ ]. تقوم المؤسسة دوريًا 
بإضافة بطاقات للمخطوطات. وي زيارة حديثة للموقع تم حصر فهارس 177١‏ 
مخطوطا. يسمح الموقع بالبحث 2# الفن: وي عنوان المخطوط؛ وك أول المخطوط 
وآخره. أو جميع بيانات المخطوط السابقة. ويظهر رسم توضيحي ه مثالا للبحث 
موقع مكتبة المسجد التبوي. يفتقذ الموقغ إلى تنوع مجالات البحث: كما تفتقد 
بطاقات المخطوطات إلى الشمول؛ وهناك نقص يذ كثير منها. إلا إِنَّ الاستمرار ب 
تحديث هذا العمل وتحسينه قد يجعله من المراجع الرئيسة 4# فهارس المخطوطات 
الرقمية ك المستقبل. 


/ 


ا ا لك 


دعجم يوي 
خدمات المكتبة والباحثين 
+ قدا بحت عرس للست خنمة البحث يفهارس المخطوطات 
© خنفة البحث يقهارير 
د إختر اعوض ١‏ الكل أب عرض 


ألكل 10 
التصنيف ‏ |« 

إسم المخطوط : به (جرء مو 
ول معطو أت" 


آخر المخطوط تعد سحب 
تاب الدمعه بفصلها 


أبواب السعادة هي أَسباب الشوادة 


ابسن اليلب في الجواب عن إبرلا أقل خلب 


المقامة الهصزية في التسموف 


دقم الحاسب* _ 8970 
آخر المتطوط 
وحسبنا ‏ وعم الوكيل - أخيرنا الحافظ أو طاشر .. أحهد بن محمد السلفي. | ..وقوله الضرب يبن يديك باتسيف دليل على العدبة لأن عن أحب نبا ألاب عنة 
الأصهاني قان؛ أخرنا ... أن عبد الله القاسم نن الفصلٌ. ... محاقد أعد ه ونب عنه .. 


رقم الحسب: 8970 
ناسخ المخطوط اسنة النسخ | درحة الخ أعدد الأوراا فود | عرض الأ انوع الخط 


رسم توضيحي ه : مثال لخدمة البحث بفهارس مخطوطات المسجد النبوي. 

وللقارئ مراجعة موقع جامعة ميتشغان الأمريكية للمزيد من المؤلفات والمواقع 
المعنية بفهارمس المخطوطات والإسلامية. إذ قاموا بفهرسة مجموعة كبيرة من 
روابط فهارمس المخطوطات الإسلامية الرقمية حول العالم [؟؟] مع توصيف 
مختصر لها. ونحن سنخصص الفصل القادم لذكر جهود الباحثين والمؤسسات 2 
قواعد بيانات المخطوطات الرقمية؛ مع إيراد أبرز هذه القواعد وميزاتها وعيوبها. 
ومن الجدير بالذكر أنَّ قواعد البيانات الإلكترونية للمخطوطات تعد كذلك فهرسًا 
لهذه المخطوطات,: فمن الممكن إضافة كل ما سيذكر 4# الفصل القادم ضمن 
قهارئن الخطوطات الرضية به هذا الفسيل: 
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". قواعد المخطوطات الرقمية 

اختلف الباحثون 2# تقدير عدد فهارس المخطوطات العربية والإسلامية, كما 
اختلفوا 4 تقدير عدد المخطوطات نفسها. ويرجع هذا الاختلاف إلى عدّة أسباب؛ 
أهمّها عدم وجود مؤسسة رسمية تعنى بإحصاء دقيق ودوري لهذه المخطوطات. 
كذلك من الأسباب عدم الاتفاق # تحديد ما يراد إحصاؤه؛ فهل يراد حصر 
المخطوطات الإسلامية بلغاتها المختلفة أوإدخال المخطوطات العربية بعلومها 
كافة5 وأيضًا الاختلاف 4# تحديد القرون المراد إإحصاء مخطوطاتها؛ ووجود عدد 
من المخطوطات ذات الملكية الخاصّة أو المخطوطات المفقودة أو المسروقة التي لا 
يمكن إحصاؤها إلى غيرها من الأسباب التي تجعل التفاوت -حتى #4 الأرقام 
التقديرية للمخطوطات- كبيرًا بين المصادر المختلفة. فمنهم من يقدّرها بمليوني 
مخطوطة. أو ثلاثة ملايين؛ ومنهم من يوصل عددها إلى خمسة ملايين مخطوطة, 
مع شبه اجماعهم على أنَّ عدد المخطوطات العربية والإسلامية بالملايين. ويذكر 
الباحثون أنَّ أكثر هذه المخطوطات # تركيا ( 7٠١.٠٠١‏ إلى ١٠٠.0٠7؟).‏ كما 
يقدّرون أن إيران والهند واليمن يملكون مئات الآلاف من المخطوطات كذلك [77]. 
و الدول العربية؛ فقد انتشر مؤخرًا 4 الجامعات والمؤسسات التعليمية الاهتمام 
بجمع المخطوطات الأصلية وفهرستهاء فعلى سبيل المثال تقدّر عدد المخطوطات 2 
جامعة الملك سعود 4 المملكة العربية السعودية بأكثر من 77 ألف مخطوطة أصلية 
ومصورة. أمّا بشأن المخطوطات المصورة؛ فقد بدأت تظهر جه ود أفراد يملكون 
عشرات أو مئات الألوف من المخطوطات. 


الجمع اليدوي للمخطوطات 

يقوم بعض الباحثين والمهتمّين بالمخطوطات بالمسح الضوئي لهذه المخطوطات 
وقتة الصمور 1ه مواق ماني الانترمكه تراك على شيل القا ل ضنها سوق 
"جامع المخطوطات الإسلامية" [15]: وموقع ' مركز ودود للفهارمس وكتتب 
التحقيق" [5؟]؛ وقسم المخطوطات # موقع '"ملتقى أهل الحديث" [0؟]؛ وقسم 


ام 


ا الو ل [1]. إلا إنعء العبارطكتاي رمفووينة” 
08 مفصّلا 200 وليست 0 اك ارو مما يقلل 
من فائدة هده المخطوطات 2 البحث العلمي. 


جهود الباحثين 4 علوم الحاسب الآلي 4 رقمنة المخطوطات 

من اهتمامات الباحثشين 4# علوم الحاسب الآلي تطوير البرمجيات المختلفة 
المعنية بخدمة المخطوطات العربية والإسلامية. إذ من الممكن استخدام قاعدة 
البيانات 4# مجال التعرف الآلي على نصوص المخطوطات,. وي تحليل ومعالجة 
صور صفحات المخطوطات آليّاء والتعرف الآلي على مواقع الكتابة والرسومات 
والصور والجداول وغيرها وتقسيم صور المخطوطات آليّا إلى مناطق أو أجزاء 
وتوصيف هذه الأجزاء. كما يقومون بتطوير أساليب البحث الآلي النصي ف 
صور المخطوطات التي تم مسحها ضوئياء والتعرف على كلمات صور المخطوطات 
آليَاء بالإضافة إلى تطوير أساليب التعرف الآلي على خط الناسخ., والتأكد منه 
المخطوطات العربية والإسلامية. إلا إِنَّ تطبيق هذه العلوم بحاجة إلى قاعدة 
بيانات للمخطوطات بمواصفات خاصة ستتم مناقشتها 2# الفصل الخامس. لذا 
قام بعض الباحثين 4 علوم الحاسب الآلي بمحاولات فردية لبناء هذه القواعد, 
نذكرخ الفقرات القادمة أمثلة عليها؛ ولكن من الملااحظ أنَّ هذه الجهود عادّة ما 
تخدم جانيًا ما ل علوم الحاسب الآلي مع عجز ب خدمة جوانب تيا الخرى كدان 
الكثير منها يحوي عددًا قليلا جدًا من المخطوطات:. بل إِنَّ الكثير منها لا يتجاوز 
جهده المخطوط الواحد فقط. 


من الأمثلة على هذه الجهود والمحاولات ما قام به قسم علوم الحاسب الآلي 
وتقنية المعلومات 2# جامعة مالاي[١؟]‏ © ماليزيا إذ جمعوا ١79‏ مخطوطة 


44 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


بالإضافة إلى توفير قاعدة البيانات لهذه المخطوطات على الإنترنت: إذ قام 
الباحثون بتوفير البيانات الوصفية المناسبة لكل مخطوطة باستخدام مبادرة ترميز 
النصوص (1181) [77] التي ستتم مناقشتها بتفصيل 4# الفصل الخامس. 


أما حسين نفشي وزملاؤه # مختبر سينكروميديا التابع لجامعة كيوبيد ب 
كندا [18] فقد جمعوا ١١‏ صورة من صور المخطوطات التاريخية والكتب التراثية 
الفارسية كانت 4# خزانة السجلات التاريخية والوثائق والمخطوطات القديمة 
لميرزا محمد كاظميني + يزد. إيران. ويظهر #ْ الصور المجموعة آثار الرطوية 
والطممس والتلاشي ونزيف الحبر نظرًا لتقادم الزمان. ومع قلّة عدد الصور ب 
قاعدة البيانات فَإِنَّ الباحثين يأملون أن تكون هي النواة الأولى ب سلسلة من قواعد 
البيانات التي توفر صور المخطوطات؛ للمساهمة 4# علم تحليل الصور والوثائق 
الإلكترونية والتعرف على نص الكتابة والكاتب. 

كما قام الباحثون رضا مقدّم وزملاؤه # مختبر سينكروميديا وجامعة ماكفيل 
اخ كندا بتقديم قاعدة بياناتهم المسماة "ابن سينا" [19]؛ وأدخلوا فيها مخطوط 
"كشف التمويهات # شرح التنبيهات' من تأليف سيف الدين أبي الحسن علي بن 
أبي علي بن محمد بن سالم الآمدي (ت١151ه)‏ وهي تحوي ردًا وتعليقًا على شرح 
الرازي لكتاب الإشارات لابن سينا. تتكون قاعدة البيانات هذه من 0١‏ صفحة: 
قام الباحثون باستخراج 7١777‏ جزءًا من كلمة عربية منها. تم التعرف على نص 
المخطوط آليّا والتحقق من نتائج التعرّف يدويًا. يظهر رسم توضيحي 5 أمثلة على 
جهود الباحثين # علوم الحاسب الآلي المذكورة سابقًا 4 رقمنة المخطوطات. 
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(أ) جامعة مالايا (ب) حسين نفشي ١‏ (ج)رضا مقدم وزملاؤه 


7 وزملاوه ‏ +" 39> 
رسم توضيحي ": صور لبعض ال مخطوطات من قواعد بيانات رقمية من 
قبل باحثي # علوم الحاسب الآلي. 


جهود المؤسسات والجامعات 4 رقمنة المخطوطات 

تتابعت ف الآونة الأخيرة عدد من المؤسسات والجامعات على بناء قواعد 
بيانات رقمية ضخمة للمخطوطات العربية والإسلامية تميزت باحتوائها على 
مئات أو آلاف المخطوطات. مع توصيف لهذه المخطوطات. وإمكانية البحث أ 
الحقول المختلقة. وتصمّح صور المخطوطات. ورغم أهمّية هذه الخصائص اذ 
قَوا عد البياتات الرُفضة: إلا إن التلاحظ أن هذه الحهود موجية ف الآضل تلياحتي 
العلوم الشرعية مع عدم أخذ باحثي علوم الحاسب الآلي بعين الاعتبار. فممًا 
يعيب هذه القواعد عدم اكتمال وصف كثير من المخطوطات أو عدم تدقيق ذلك 
التق كن باتسوو حك انه "القاريع ذا : رظنن خلال نحا دن تكن الي 
أوتوصيف لأجزاء الصفحات المختلفة. كما إن كثيرًا من هذه المواقع لا تسمح 
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وقتويةاواللععلو حل ات دعق تعتون محموده سيقي سيق اللخطوطظات (انلكانت 
أو الآلاف) التي يحتاجها باحث علوم الحاسب الآلي ف برمجياته5!كما إِنَّ كثيرًا 
المخطوطات والوثائق التاريخية. وعلى الكثير منها علامات مائية كبيرة الحجم 
تؤثر على صورة المخطوطء مما يؤكد الحاجة إلى إعادة تصميم قواعد البيانات 
هذه لخدمة الباحثين # العلوم المختلفة على أفضل وجه ممكن. 


وهنا تظهر مدى الحاجة 4 ربط تواصل بين المبرمج والباحث # العلوم 
الإنسانية والشرعية؛ وهوعمل لا يتمٌّ إل بوجود تعاون بين مؤسسات تعنى بعلوم 
البحث التراثي بالتعاون مع مبرمجين أكفاء يؤمنون بسمو الهدف وثمرته الحقيقية, 
وهذه المؤسسات كثيرة 4 بلادنا العربية ولكنها تفتقر إلى تنظيم يجمع آليتها 
ويجمع جهودها. 


نظام المخطوطات (جامعة المللك سعود 

سعود # المملكة العربية السعودية [١؟].‏ وهونظام قامت بإنشائه جامعة الملك 
أكثر من إاحدى عشرة ألف مخطوطة: ويستطيع المستخدم تصفح المخطوطات, 
وقراءتها ومعرفة بعض المعلومات التفصيلية عنها من مؤلف وعدد صفحات وغير 
ذلك. ومن مميزات هذا النظام أنَّ خدمته تعمل على شبكة الإنترنت مما يسمح 
للمستخدمين بالدخول من أي مكانء كما إِنْ واجهة المستخدم تدعم اللغتين العربية 
والإنجليزية. 


4١ 


للباحثين والمهتمين بتفريغ نص المخطوط وإرساله إلى نظام المخطوطات؛ لمراجعته 
حتى يتمكن توفير خدمة البحث # نص المخطوط ‏ المستقبل. لذا يمتلك نظام 
المخطوطات 4# جامعة الملك سعود عددًا من المقومات اللازمة للباحثين 4 علوم 
الحاسب الآلي لتطوير بحوثهم 2 خدمة المخطوطات العربية الإسلامية؛ لكنّه 
بحاجة إلى عدد من التعديلات والتصحيحات لجعله ملائمًا لهذه الأبحاث. 


نكم جاسصعة 
كع المزك سعود 
إي؟) :نا لاحك داكا 


لصفحة الرئيسية ا ستعرا 


مخطوطات > الاذثيارات > الصفحة رقم 6 


عنوان المخطوطة: الاختيارات أول السابق 1 5 180١‏ التالي آخر 
رقم الصنف؛ 2075 ال 0 اللسسصس : 
الموّلف: ابن التدام ٠‏ على بن محمد , . 1 

الرقم العام: 3529 5 


التاريخ المقترن بإسم المؤلف: -803 ه 
المراجع: معجم المؤلفين 7 : 206 

الوصف؛ نسخة جيدة ؛ نسح معتاد , بها نقص 

الوصف المادي: 121 ق ؛ 22 س ؛ 21 > 15 سم 
الموضوع: المذهب الحتبلي 2 فقه المذاهب الاسلامية 
الإحالات: | - المؤلف ب - تاريخ النسخ 

اسم الثاسة: 

تاريخ النسخ: 1232 ه 


785 احصل على الضفحة بصيفة بي دي إف 
ا هذه المخطوطات هي خذمة مقدمة من جامعة الملك سعود تهدف لخدمة الباحتين وتوفير آليه للحصول على المخطوطات التادرة يطريقة سهلة وميسرة 


نرجو استخدام هذه الخدمة بطريقة معتدلة ومسؤولة. 


ساهم في خدمة الباحتين بتحويل الصورة إلى تّص مكتوب قابل للبحث 
رسم توضيحي /: صورة توضيحية لنظام المحطوطات 4 جامعة الملك سعود. 


وبالرغم من توفر هذه المقومات # نظام المخطوطات التابع لجامعة الملك 
سعود. إلا إن الوضع الحالي للنظام لا يسمح للباحثين باستخدام المخطوطات 
العربية والإسلامية. إذ يسمح النظام حاليًا فقط بتصدير كل صفحة من المخطوط 
على انفرادء ولا يسمح بتصدير المخطوط بأكمله فضلًا عن تصدير مجموعة من 
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التطاوظ ]سوقم وإتكن فكي إن الحور الكروظنة مسنوحة ورك ولت مضه 1 
نقطة لكل إنثس) مقارنة بالمعايير المتبّعة ب مسح المخطوطات والوثائق التاريخية 
٠٠0(‏ نقطة لكل إنش) مما يؤثر على قابلية استخدام هذه الصور ف الأبحاث 
العلمية؛ ناهيك أنَّ القائمين عليها قاموا بإضافة علامة مائية كبيرة الحجم تؤثر 
على الكتابة# المخطوط كما هو مبين 4# رسم توضيحي 1. وممًا يلاحظ أيضًا أنَّ 
المعلومات المقدمة عن المخطوط قليلة: وي أحيان كثيرة تنقصها بعض البيانات 
خاقة انب التاسع 


رسم توضيحي 8: مثال على صور إحدى المخطوطات من قاعدة بيانات جامعة الملك سعود. 


مجموعة المخطوطات الاسلامية لجامعة ميتشغان 

ومن جهود الجامعات 4# توفير قواعد بيانات إلكترونية للمخطوطات. نذكر 
'مجموعة المخطوطات الإسلامية" 4 جامعة ميتشغان الأمريكية [7؟]. تملك 
الجامعة ١/46‏ يخوطلا إسا ما كاسث مرك بسار معني اشيفة 


0 


الإلكترونية - إلى تاريخنا الحالي - وتوفيرها مجانًا للباحثين والمهتمين؛ كما 
يسمخ النظاف يتعميل صشحة مزخ المخطوط أ الخطوظ كاملا بالإضافة إلى عترضن 
فهرمس لكل مخطوط ( رسم توضيحي ) مع إمكانية التبرع بإضافة الفهارس أو 

نص المخطوط. تتميز مجموعة المخطوطات الإسلامية بوضوح صور المخطوطات 
وجودتهاء كما إن العلامة المائية موضوعة خارج إطار صفحة المخطوط؛ فلا تؤثر 
حل الأبيجاث المتية بالتخطوط:وممًا بعيبها عد شمؤلية بطافات المخطلوظ كما 
إِنَّ الملفات المحملة تكون بصيغة (52015) بدلا من صيغ الصور المناسبة للأبحاث 
العلمية (21106 1115 ,386). ومن الجدير بالذكر أن موقع مجموعة المخطوطات 
الإسلامية 4# جامعة ميتشغان على الشبكة الإلكترونية يحوي العديد من المعلومات 
القيمة»؛ والقوائم المفيدة 2# اللفة الإنجليزية للمهتمين بأبحاث المخطوطات 
الإسلامية والعربية؛ مثل البحث عن المخطوطات 2# الفهارسء وقائمة بأسماء 
فهارس المخطوطات,. وفهارس المخطوطات الإلكترونية وقواعد البيانات الإلكترونية 
للمخطوطات الإسلامية؛ إضافة إلى العديد من الدراسات المهتمة بالخط العربي, 
والكقيرين الواضيم الأخرى التى نيا تلق بهذ[ الفن: 


و ا اظ؛ <« 4 4 


غم جه عسهم 


5 3-6 ك ون 


ا 
. 

0 

0 
5 
0-2 


«الرساه هما زر 0 33 

ليزرك التوعءجدءنا جنا عرو 0ل 0 -- 

رسم توضيحي 4: مجموعة المخطوطات الإسلامية 3 جامعة ميتشغان 
الأمريكية. 
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يلاحظ من الأمثلة السابقة مدى اهتمام المؤسسات والمكتبات والجامعات 
مؤخرًا ‏ تملك المخطوطات العربية والإسلامية ورقمنتها (تحويلها إلى صور 
حاسوبية) . وللمزيد من هذه الأمثلة؛ نحيل القارئ إلى موقع مكتبة جامعة ميتشغان 
الأمريكية [؟"] فقد ذكر الموقع قائمة من مواقع الإنترنت المحتوية على قواعد 
بيانات للمخطوطات الإسلامية الرقمية؛ مع ترتيبها على حسب الدولة؛ والجدير 
بالذكر أنَّ غالب هذه الجهود مقدّم من قبل جامعات,. وأنَّ غالبها ب دول غير 
عربية وهي المخطوطات العربية والإسلامية الموجودة 2# أوروباء مما يدل على حجم 
المشكلة ومدى تقصير الجامعات والمؤسسات العربية تجاه هذا التراث العظيم. 


برنامج مكتبة الملك عبد العزيز العامة بالرياض 

نزي :)السب العوور عاقيا ريام 151 | بحا قفا رهن ارصن 
المخطوطات التابعة للمكتبة كإصدار أولي تجريبي منذ ما يقارب خمس سنين: على 
أنيتمٌ تحسين البرنامج وإصدار نسخة نهائية للجمهور للاستفادة منه. ولكن لم 
يتم اصدار النسخة النهائية إلى يومنا هذا للأسف. يحوي البرنامج ما يقارب 
مخطوطة مختلفة: ويسمح بالبحث 4# اسم المخطوطء أو اسم المؤلفء أو 
رقم الحفظ؛ كما يظهر من رسم توضيحي .٠١‏ يتميز البرنامج بإمكانية رؤية صور 
اللعطرط نينط لقص ]نحن الت سين الاوك جال لبي تقل لطر وق 
التباين» وتكبير الصورة. يفتقد البرنامج إلى توصيف دفيق لبطاقات المخطوطات, 
فهو يكتفي فقط بتحديد ثلاثة حقول ( اسم المخطوطء اسم المؤلفء ورقم الحفظ)» 
ويعرضن باقي المعلومات كملف من غير تنسيق. كما إِنْ مرور الأعوام من غير 
إصدار البرنامج للجمهور أو إعلان تحديثات عليه تقلل من أهميته # مجال رقمنة 
المخطوطات العربية والإسلامية. 
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(أ) شاشة البحث مع الشاشة الرئيسية للبرنامج (ب) شاشة عرض ال مخطوط 

رسم توضيحي ٠١‏ : برنامج مكتبة الملك عبد العزيز العامة بالرياض. 
مشاريع مستقبلية 4 رقمنة المخطوطات 

ثمة عدد من المؤسسات التي تذكر مشاريع مستقبلية 4 رقمنة المخطوطات 

العربية والإسلامية: نذكر على سبيل المثال منها مؤسسة الفرقان التي أعلنت 
شروعها 4# بناء أكبر قاعدة بيانات للتراث الإسلامي على الشبكة العنكبوتية 
[117: كما قامت جامعة ماكفيل جا كندا بتأسيس مشروع "العلوم العقلانية بخ 
الإسلاي”" (ستهاذآ مز وععمعكك5 لهدمتهع) [5؟] والذي يهدف إلى دراسة التراث 
الفلسفي والعلمي والديني للمسلمين بطريقة شاملة. ويتوقع القائمون على هذا 
المشروع أن يرفد الباحثين والمهتمين بعشرات الآلاف من المخطوطات الإسلامية 
بصورة ميسرة وعلمية؛ ولقد عمدوا إلى تقسيمه لعناصر ثلاثة: منها اثنان خاصان 
برقمنة المخطوطات الإسلامية: 


«» التقاليد العلمية ‏ المجتمعات الإسلامية (5115): يهدف إلى دراسة تأثير 
العلوم الإسلامية على العلوم الحديقة 4 أوروباء وتأثير الكتابات الغربية 
ما قبل القرن الثاني عشر الهجري على الباحثين # الدول الإسلامية. 
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مبادرة لبناء قاعدة بيانات © مخطوطات الفلسفة الإسلامية ما بعد 
الكلاسيكية (2121(1): يقوم الباحثون بإنشاء البنية التحتية العلمية 
المناسبة لإجراء دراسات منهجية # النصوص الفلسفية الإسلامية 
التي يرجع تاريخها إلى ما بين القرن الخامس إلى القرن الثالث عشر 
الهجري. وتشتمل قاعدة البيانات على مخطوطات أ المنطقء؛ وش فلسفة 
اللفة؛ ونظرية المعرفة: والأخلاق, والميتافيزيقياء والفلسفة الطبيعية 
وعلم الكونيات؛ وفلسفة العقل. 

مبادرة المخطوطات العلمية الإسلامية (150/11): يهدف هذا المشروع 
إلى توفير مجموعة واسعة من المعلومات حول العلوم الدقفيقة © 
العالم الإسلامي قبل العصر الحديث؛ من خلال تقديم هذه العلوم 
والمخطوطات إلى الباحثين والخبراء بلا مقابل عن طريق الإنترنت؛ 
وإلى تثقيف الجمهور # جميع أنحاء العالم # العلوم الإسلامية. وينتظر 
أن تحتوي قاعدة البيانات على أعمال ما يقارب 1٠١‏ مؤلمًا وعامًا 
مختلف أرجاء العلام الإسلامي من إسبانيا الإسلامية إلى الهند 
وحدود الصينء منذ بداية القرن الأول الهجري حتى القرن الثاني عشر 
الهجري. وتتراوح موضوعات هذه الأعمال بين علم الفلك؛ والرياضيات, 
والفيزياء. والجغرافياء والميكانيكاء وعدد من التخصصات ذات الصلة. 


وبعد ذكر جهود ومحاولات الباحشين والمؤسسات 4# رقمنة المخطوطات مع 
ذكر أمثلة على أبرزهاء ومزايا وعيوب هذه المحاولات. ويندرج 4# هذا الباب كذلك 
الجهود المبذولة 4 محاولة جمع قواعد بيانات خاصة بخطوط العلماء السابقين 
وناسخي المخطوطات. وهذا ما سيتم تفصيله 4 الفصل القادم. 
جمع نماذج من خطوط العلماء 

اهتم العلماء السابقون بتحصيل نماذج من خطوط العلماء والنساخ والمشاهير 


4 


وجمعها 4 كتب, وقد دعت الحاجة كش زماننا الحالي إلى بناء قاعدة بيانات رقمية 
تحوي عددًا كبيرًا من الخطوط الموجودة # الوثائق التاريخية العربية والإسلامية 
نا ركس 3 وموم ضيف ساد ] للقطرطة الاوتعفها نهنا رم قل ا الها ينين 
الآلي والاستفادة منها. إِنَّ بناء قاعدة بيانات تعد عملية أساسية للأبحاث المتعلقة 
بتحديد هوية صاحب الخط والتعرف على الكتابة 4 اللغة العربية؛ إذ من الممكن 
استخدام قواعد بيانات الخطوط يذ الوثائق التاريخية العربية والإسلامية المكتوبة 
بخط اليد 4 المجالات البحثية التالية: 


. ) ١1161 تحديد هوية كاتب المخطوطات العربية والإسلامية (2602ع6تأمعل1‎ .١ 

". التأكد من هوية الكاتب (2600عقتره/؟ ج7116" ) . 

". التعرف على الخطوط المزيفة وتمييزها, والمساعدة 4 كشف المخطوطات 

المزورة. 

4. قاعدة بيانات مرجعية للباحثين؛ لاختبار أنظمتهم وأساليبهم المطورة. 

ورغم اعتناء العلماء بخطوط العلماء والنسّاخ منذ مئات السنين: وجمع هذه 
الخطوط وطباعتها ‏ كتب مفردة: إلا إِنّهِ لا توجد للآن قاعدة بيانات متاحة 
للباحثين تعنى بخطوط النسّاخ والكتّاب # المخطوطات التراثية. نذكر 4# هذا 
الفصل أمثلة على كتب مطبوعة اعتنت بجمع خطوط العلماء والنسّاخ مع ميزات 
هذه الكتبء. ثم نذكر بعض الجهود المبدثية ‏ بناء قاعدة بيانات رقمية مختصة 


بخطوط كتاب المخطوطات العربية والإسلامية. 


كتب مطبوعة اعتنت بجمع خطوط العلماء والنساخ 

من جهود علمائنا السابقين ب# هذا المجال ما جمعه الحافظ المؤرخ محمد بن 
على ابن طولسون التمققي "ثوادن الإجاؤاتوالسجاعات" [ ]من خطوظ علماء 
مكة ومصر والشام ما بين عام 45-47٠0‏ ه. ححَقّق الكتاب عام 515١ه‏ من قبل 
كبن قطن احاسظ: وكوي الككاته اع تفقتره إنخنا 8 الاضافة إلى سؤاهات 


1 
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لأحاديث وتراجم وأسانيد لأمهات الكتب الإسلامية. ويدل هذا الجمع على اهتمام 
المتقدمين بخطوط علمائهم وتوثيق إجازاتهم وأسانيدهم توثيقا صحيحًا. 

ومن أمثلة جهود علمائنا المعاصرين قيام خير الدين الزركلي بتأليف كتابه 
"الأعلام" [17] إذ حوى ثمانية مجلدات من تراجم المشاهير والأعلام من العلماء 
مختلف الفنون: كالأنبياء, والمللوك والسلاطين؛ والشعراء؛ وغيرهم. كما قام 
بتوثيق وإضافة صور لعينات من خطوط مئات من الأعلام قديمًا وحديثًا. 


كما قام ستيفن ليدر وزملاؤه بجمع وانتخاب السماعات الدمشقية الموجودة 2 
دار الكتب الظاهرية 4 مخطوطات عام إلى ١6لاه.‏ قام المؤلفون 4 كتابهم 
"معجم السماعات الدمشقية" [8؟] بتحليل ١170١‏ سماعًا بالإضافة إلى توصيف 
كل سماع بما فيه الشيخ المسمع؛ وقارىّ السماع؛ وكاتبه؛ وناقله؛ والمستمع؛ ورقم 
الخطوط مورق السا..ودكان السماء دوومان السشاء ذوعيو دلق 


ومثلهم جمع عبد الله وجاسم الكندري نماذج وأمثلة من خطوط العلماء من 
القرن الخامس إلى العاشر الهجريء إذ حوى كتابهما ''خطوط العلماء من القرن 
الخاممس إلى العاشر الهجريء نماذج وأمثلة" [9؟] ثلاثمائة نموذج لخطوط 
الجلقاة مق الشماعات الختافة مم كتوضيك وتفرية كحصن كل سماء ويظهر أن تاب 
الكندريّين اعتمد بكثرة على الاقتباس من كتاب ' معجم السماعات الدمشقية" 
لليدر وزملائه لكثرة النقولات. ويظهر رسم توضيحي ١١‏ نماذج مقتبسة من الكتب 
المذكورة آنفًا مع التمثيل ببعض خطوط العلماء. 
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سمع جميع هذا اإمرء وهر الثاتى وما قل هما بعدة إلى مر الإكناب على الشيخ 
السالح الأجل المبيد تميب الدين ابي ساق إبراهيم برح ليل بن علد الله الأدمي 
بعاعه قيه من ابن الحتزوي سبد السادة : الأخل الفاضل الجالم المخدث 
«الدين أبو الفاسم غاني بن سي اللدين بايالا بن عبط *للهالمشر ف التضري : والشيم 
الققيه الإمام المالم اخافا 


الدمشقيء والكيخ الدقبه حيثية القين أب خسزو عجان بن غلي بن كانت الحمزيء 


لمر أل للسامل يمتها بن ملكتن معمود 


(د) كتاب عبد الله وجاسم الكندري ‏ 9" 
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قواعد بيانات رقمية معنية بخطوط العلماء 

اعتنى الباحثون 4# علوم الحاسب الآلي بالتعرف على الناسخ # المخطوطات 
الغربية؛ وكثرت الأبحاث 2# هذا المجال - نذكر على سبيل المثال منها [١غ‏ - 27 ], 
ولكنْ اعتنائهم بالمخطوطات العربية والإسلامية يكاد يكون منعدمًا. فعدا عن بحث 
خاص بصاحب المقال [44]؛ وبحث آخر عرض حديثًا [40]. لا تجد بحذًا مختصًا 
َفُصَلة عن قاهدة بيافات ركبية متخسطرة- دف هذا العال, 


قام الباحث ف بحثه ''التعرف على الكاتب مستقالا عن النص ف المخطوطات 
العربية التراثية وتأثير زيادة عدد الكتّاب" ١‏ «لتتمعل1 ع1 أمع لمع معلم] كه 1" 
11635 0177115 أعع 88 عطا ممه كأاماتءسنتصد/! عاطوتك أمعاعمط 01 ممتلده 
" [؛:] ببناء قاعدة بيانات للوثائق التاريخية العربية والإسلامية المحتوية على 
عينات مختلفة من تأليف العلماء العرب والمسلمين. تحوي قاعدة البيانات صورًا 
متي مخطوطة مختلفة: تم اختيار خمس صور من كل مخطوطة؛ ليصبح عدد 
صور قاعدة البيانات ٠٠٠٠٠١‏ صورة لمئّتي خط ناسخ. واستخدمت قاعدة البيانات 
المطورة لفحص هوية الكاتب والتحقق منها. وعند استخدام نظام تمييز النمط 
وبرمجيات التعرف على الكاتب المطورة تم تحقيق نسبة نجاح تقديرها: 7/3540 
خش التعهرف على الكاتب. وتعد هذه النتائج المشجعة دليلا على قدرة الترمجيات 
والحاسب الآني على تمييز الخطوط ف المخطوطات والوثائق التراثية. إلا إِنَّ هذه 
النتائج بحاجة إلى عدّة تجارب معتمدة على قاعدة بيانات تحوي عشرات الآلاف 

مسن الملخطوطات! للتوثق من التتاكع اوهو الذي توصو المؤسفات البحثية التي تُعنى 
بالتراث وتحرص على إقادة الياحثين الوقت يهو اعاية جا اكقسيله قلي رطق 
الواقعلما لنتائجه - بإذن الله - من حفظ لتراثنا ‏ صورة علمية وعملية: ولما فيه 


من تقديم لبر ا لاوا الو ا قيق تراث الأمة ولما 
ا المستقبل. 


وبعدما قمناج الفصول السابقة بذكر واقع وحاضر قواعد البيانات الإلكترونية 
للمخطوطات التراثية: وميزات الجهود الحالية: وأبرز العيوب والعوائق الحالية, 
نذكر.# الفصل القادم مقترحًا لمواصفات قاعدة بيانات مستقبلية للمخطوطات 
الإسلامية والعربية وعرضها بالتقنية الرقمية. مع الخيارات والميزات التي تمكن 
قاعدة البيانات المقترحة من خدمة باحثي العلوم الإسلامية؛ وعلوم الحاسب الآلي 
بناء قاعدة بيانات للمخطوطات الاسلامية وتوصيغها 

:4 هذا الفصل نقترح بناء قاعدة بيانات رقمية للمخطوطات الإسلامية 
والعربية بمواصفات ومعايير عالمية معتمدة؛ تسمح بتطويرها واستخدامها 4 بحوث 
الحاسب الآليء بالإضافة إلى الاستفادة منها من قبل الباحثين والمهتمين بالتراث 
العربي والإسلامي. تبدأ عملية بناء قاعدة البيانات بمسح صور المخطوطات آليا 
وتخزينها على الشبكة العنكبوتية؛ فيتم مسح هذه الصور باتباع المعايير العالمية 
.4 مسح المخطوطات والوثائق التاريخية ( بدقة ٠٠١‏ نقطة لكل إنش) . وبعد القيام 
بمسح صور المخطوطات آليّاء نقوم بتوصيف رقمي للمخطوط وصوره للاستفادة 
منه على أفضل وجه. ولتحقيق هذه الغاية: لا بد من تعريف القارئٌ بمبادرة ترميز 
وتبادل النصوص الرقمية (111' - 8656 تائم[ عمتل مهعم 102 ) 371 ]. 


مبادرة ترميز وتبادل النصوص الرقمية 

قبل إنشاء مبادرة ترميز النصوص بوصفها نتاج عمل مجلس تعاوني مشترك, 
لم يجد علماء العلوم الإنسانية معايير موحدة لترميز النصوص الإلكترونية تخدم 
باسم مبادئ باوكيبسي . ثم تطويرهاء وتم إعلان مبادرة ترميز النصوص 
الرقمية [1؛]. 
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تقوم مبادرة ترميز النصوص على تحديد مجموعة من العلامات التي يمكن 
إدراجها ث4 التمثيل الإلكتروني للنصوصء وذلك لتعريف بنية النص ووصفه بطريقة 
دقيقة, إذ تعتمد برامج الكمبيوتر على وجود مثل هذه العلامات الواضحة لمعالجة 
النصوصى بطريقة صحيحة؛ فبدونها يبدو النص الرقمي سلسلة من الأحرف غير 


ع سن ضعت المخطوط" (دمتامتهوء7 أمتتءئتاصة21) [/غ ] من 
الوحدات المتخصصة المندرجة ضمن نظام ' ترميز النصى الإلكتروني وتبادله" 
التي يمكن استخدامها لتقديم معلومات وصفية مفصلة عن الوثائق التراثية 
والمخطوطات المكتوبة بخط اليد. وعلى الرغم من أن عنصر وصف المخطوط 
صمُم أصالة لترميز المخطوطات # التقاليد الأوروبية 3 العصور الوسطى, فَإنَّ 
برمجيته عامّة وشاملة؛ إذ يمكن أن تمتد إلى جميع الوثائق التاريخية بغض النظر 
عنوان؛ ومواد, وتاريخ ومكان المنشأً. وللتعريف يعنئصر وصف المخطوط »,2 تقوم 
بالتعريف ببعض حقوله: 
»و 12510650: حقل يتفم وْصِما أو أكثر للمخطوط. 
115106216615: معرف للمخطوطء يحتوي على المعلومات المطلوبة لتحديد 
المخطوط. 

©« 20عط: يحتوي على أي نوع من العناوين: مثل عنوان القسم. أو عنوان 
القائمة: عنوان المخطوط. 

9 25)02]6215: يتضمن محتويات المخطوطء كما يصف المحتوى الفكري 
للمخطوط أو جزء من المخطوط. 

ل 015105 يحتوىي حقل الوصف المادي على الوصف المادي الكامل 
أكخر تخصصا. 


١٠١7 


لإاماوقط: مجموعة من العناصر تصف التاريخ الكامل لمخطوط أو جزء 
من مخطوط. 

© 1257316: حقل يحتوي على معلومات حول جزء من المخطوط. 

» 0126251085: مواصفات أبعاد المخطوطة؛ أو صفحة معينة من المخطوط؛ 
أو جزءًا منها. 

© 10015: يحدد موضع وإحداثيات موقع داخل جزء من الملخطوط. 

513611281: وصف للمواد التي يتكون منها المخطوط. 

©» >773]6111311: وصف لأي علامة ماتية أورمز ممائل 4 المخطوط. 

© علنود[لع01: يحتوي على أي شكل من أشكال التاريخ؛ وتستخدم لتحديد 
تاريخ المنشأ للمخطوطة. 

© ععواطع21ه: يحتوي على أي طريقة لوصف المكان. وتستخدم لتحديد 
مكان الأصل للمخطوطة. 


الرموزالمطلوية لتوصيف المخطوطات العربية والاسلامية 

العربية والإسلامية. مع الإشارة إلى أنَّ بعض هذه الصفات قد تحتوي على أكثر 
من مَدَّخَلء فعلى سبيل المثال: قد يحتوي المخطوط على عدة عناوين له وقد يكون 
البوليف أككر من لقي كنا نقنين إلى أن يعكن هذه الحمول قن لامتوفر تك ينض 
المخطوطات,. أولا يتم تعبثتها عند توصيفها . إلا إن النظام يسمح بإضافتها أو 
تعديلها 2 المستقبل مما يعطي مرونة لقاعدة البيانات المقترحة. 
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. معلومات خاصة با مخطوط : 
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ع 3 اه 


ل م 000 | مند#ق_ا 
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عد 
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معلومات خاصة بصفحة أو منطقة أو جزء من المخطوط: 


حَ 
1 عدد الكلمات لكل 
عدد اللأسطر امتداد السطر ارتفاع السطر 


المنطقة عاط 


مفقترح المهام الخاصّة بأبحاث الحاسب الآلي 

وأخيئراء نقوم هنا باقتراح وتوصيف عدد من المهام القادرة على استثمار 
برمجيات الحاسب الآلي # مساعدة الباحثين # مجال العلوم الإنسانية والتراث 
العربي والإسلامي. ولتحقيق هذه المهام: فلا بد من سماح قاعدة البيانات المقترحة 
للمخطوطات الإسلامية للباحثين بتحميل مجموعة من صور المخطوطات ومعلومات 
هذه الصور بأعداد تصل إلى عشرات الآلاف بسهولة وسرعة:؛ مما يتطلب أخن 
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هذه المتطلبات بعين الاعتيار عند تصميم قاعدة البيانات الرقمية, وهي الميزة التي 
تفتقدها جميع قواعد البيانات الرقمية للمخطوطات الإسلامية والعربية - للأسف 
- حاليًا. 


كما تتضمن هذه المهام تقسيم المدخلات إلى مجموعات منفصلة للتدريب, 
والتحققء والاختبارء وغيرها للمساعدة 4# تطوير البرمجيات بطريقة علمية 
دقيقة. مع الإشارة إلى أَنَّ عدد الصور أو النصوصى ال مختارة ا الفقرات القادمة 
هي أعداد مقترحة. وهي أعداد تقديرية للتمكن من تحقيق نتائج مرضية على 
مستوى عالمي # مجال التعرف الآلي؛ وتعتبر الزيادة على هذه الأعداد المقترحة 
أهر اتمضطالا :وعاليًا عد ة الخطوظ افريطة تكبية ع الهام الشترخة الخاضه 
بأبحاث الحاسب الآلي: 


أ. التعرف على الكتابة آليًا (مهاتمعمءع< 164 عنتهسمنناه ) 

تعد مهمة التعرف الآلي على نصوص المخطوطات من أهم النتائج المتوقعة 
لعلم الحاسب الآلي 4 خدمة التراث العربي والإسلامي: وهي 2# الوقت نفسه من 
أكثرها صعوبة بلا شك. فإن تحقيق نتائج مرضية # هذا المجال يعد شائكا بذ 
صور الوثائق المكتوبة بخط اليد 2# اللغة العربية عمومًاء و المخطوطات التراثية 
خصوصًاء إذ تحتاج هذه المهمة إلى الكثير من الوقت والجهد لتحضير صور 
المخطوطات - بالإضافة إلى حاجتها لتوفر نصوص هذه الصور - قبل استطاعة 
الباحث ف# الحاسب الآلي البدء ِ تطوير برمجياته. كما يحتاج إلى تحديد 
إحداثيات كل سطر 4 صور صفحات المخطوط ( بداية السطر ونهايته وارتفاعه) , 
وتحديد نص كل صورة سطر على انفراد. والحقيقة أنَّ الجهد الكبير لتجهيز مثل 
هذه المتطلبات لا بد أن يعتمد على تعاون الباحثين © أنحاء العالم؛ لكي يكتب له 
النجاح, ولذا تعتمد كثير من الجهود الغربية # مثل هذه الأمور على العمل التطوعي 
للباحشين عن طريق الإنترنت. مما يستلزم بناء الموقع بطريقة تسمح للمشاركة 2# 
هذه الجهود؛ بالإضافة إلى وجود نظام محكم للتأكد من نتائج هذه الجهود. 
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بعد تجهيز البيانات اللازمة لمهمة التعرف على الكتابة آليّاء يتم تقسيم الصور 
إلى أربع مجموعات منفصلة: نذكرها هنا مع ذكر قيم تقريبية لعدد المخطوطات 
4 كل مجموعة ( بافتراض وجود ٠١‏ آلف صورة للمخطوطات على الأقل 4# قاعدة 
البيانات المقترحة): مجموعة التدريب “20٠(‏ من صور المخطوطات) . مجموعة 
التحقق :)2٠١(‏ مجموعة الاختبار :)2١(‏ والمجموعة الإضافية .)22١(‏ مع 
ملاحظة أن يتم اختيارهذه الصور من أكبر عدد ممكن من المخطوطات؛ مع 
اختلاف العصور الزمنية» والفنون: ومكان المخطوطء وأسلوب المخطوط. وغيره. 
حيث يسمح التنوع بتطوير برمجيات ذات مرونة قابلة للتعرف على أكبر عدد من 
المخطوطات. يستخدم الباحثون عادةً مجموعة التدريب لتطوير برمجياتهم وتعديل 
معابيرها؛ لتتوافق مع صور المخطوطات المقدّمة لهاء ويستخدمون مجموعة التحقق 
للتأكد من سلامة نتائجهم على مخطوطات لم تقدّم لبرمجياتهم من قبل؛ ومن 
ثم يتم اختبار أنظمتهم على مجموعة الاختبار ومقارنة النتائج. وتحافظ الجهة 
الحانووة شاعو الم افاسيطان العووغةالأعناف تمن عجر ره اسك اميا ذه 
مقارنة نتائج البرمجيات المطورة 4 مسابقات عالمية مستقبلية: إذ تساهم مثل هذه 
المسابقات على تشجيع البحث العلمي # هذه المجالات وتقدمه. 


ب. البحث عن صور الكلمات (108أ0هم5 1717010) 

يمكن استخدام صور ونصوص مهمة ' التعرف على الكتابة آليّا" السابقة ب 
تقييم وتطوير مهمة البحث عن صور الكلمات؛: ولكن مع وضع مجموعة من الكلمات 
الاختبارية ( 50٠-٠١‏ كلمة) بالاعتبار للبحث عنها ب هذه الصور. ويفضل أن 
تكون هذه الكلمات المختارة من الكلمات المشتهرة عند باحثي التراث عند البحث 
:4 المخطوطات. ومن الممكن استخدام مهمّة 'معالجة اللغة الطبيعية" لمعرفة أشهر 
هذه الكلمات. وبعد تحديد هذه الكلمات يأتي دور تحديد إحداثيات هذه الكلمات ب 
صور المخطوطات المختارة لكي يتم تطوير البرمجيات المختصة بالبحث عن صور 
الكلمات. 
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ج. تحليل صور الوثائق (17515[دمى ء8 12[ أمعسدءه12) 

يتم مهمة تحليل صور الوثائق اختيار أكبر تنوع ممكن من أشكال صور 
المخطوطات,. إذ يتمكن الباحثون من الاستفادة من هذه الصور # تطوير العديد 
من التقنيات والتطبيقات ث4 مجال تحليل صور الوثائق؛ بما 4 ذلك على سبيل 
المشال لا الحصر: تجزئة الصفحات والفقرات والأسطرء والتعرف على الرموز 
(مشل التملكات والأختام)؛ والاسترجاع المعتمد على الشكل؛ وتمييز النص عن 
الرسومات. والتحليل المنطقي للوثائق؛ وتحديد تشابه الصفحات,. ومعالجة 
الوك اكز عن النسية وتدجا م كن بتو هذه القطبيق ]نكر أولا إن تعد يد البيانات 
والمعلومات المختصة بهذا التطبيق. فعلى سبيل المثشال؛ يستلزم تطبيق التعرف 
على الرموز تحديد الإحداثيات المثات أو الآلاف من هذه الرموز الموجودة ب صور 


د. معالجة اللغة الطبيعية (55128ع2:00 ع3281138.آ 21361121 ) 


تعد هذه المهمة من أسهل المهام # جانب التحضير المبدئي؛ إذ لا تستلزم 
صورًا للمخطوطات:. وإنما تحتاج إلى نصوص هذه المخطوطات. والتي تتوفر بكثرة 
المكتبات الإلكترونية للتراث العربي والإسلامي. ويفضل التنوع 2 اختيار آلاف 
النصوص لهذه المهمة من حيث تاريخهاء والفن المختارء وما إلى ذلك. 

ه. التعرف على الكاتب والتحقق منه ١]6252002(‏ مه دم ندع تامعل1 معات11) 

نحتاجك مهمة التعرف على الكاتب والتحقق منه إلى إضافة ترميز اسم 
الكاتب (ورقمه التسلسلي) لكل صورة 4# المخطوطء مع الاهتمام بالإكثار من 
المخطوطات المتنوعة للكاتب نفسه. وهذا يتم عن طريق البحث عن النساخ المكثرين 
من المخطوطات # قواعد بيانات المخطوطات الرقمية. إذ تساعد المخطوطات 
المتتوعة للكاتب نفسه 2# التأكد من قدرة النظام الآلي المطور على التعرف على 
الكاتب لا على المخطوط أو سنة النسخ. ويفضل أن يتم اختيار ٠١‏ صورة من داخل 
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المخطوط ( ٠٠٠٠٠١‏ مخطوط) مع استثناء صور البداية والنهاية؛ لاحتوائها عادة 
علي كتايات شير التاست مثل القنقكاك والوقتيات ال تود علس يتات البح 
ثم تقسّم الصور المختارة إلى المجموعات الأربع؛ مجموعة التدريب (7 صور لكل 
مخطوط) , مجموعة التحقق (" صور لكل مخطوط) . مجموعة الاختبار ([4 صور 
لكل مخطوط) . والمجموعة الإضافية (5 صور لكل مخطوط) . 
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خاتمة 


قام الباحث 4 هذا المقال بتفصيل واقع رقمنة الوثائق التراثية؛ مع اقتراح 
الخطوات اللازمة 4 المستقبل للاستفادة المثلى من البرامج الحاسوبية الحديثة. 
إذ تمت دراسة فهارس المخطوطات الرقمية مع ذكر أبرز المؤلفات والمواقع المعنية 
بفهارمس المخطوطات العربية والإسلامية: وذكر أبرز المزايا والعيوب لهذه المؤلفات 
والمواقع» وخاصّة 

مكتبة الفرقان الرقمية وفهارس مخطوطات مكتبة المسجد النبوي المتميزتين 
هذا المجال. وكما فصّل المقال جهود الباحثين والمؤسسات # بناء قواعد بيانات 
المخطوطات الرقمية؛ مع إيراد أبرز هذه القواعد وميزاتها وعيوبها. وخاصّة نظام 
المخطوطات التابع لجامعة الملك سعود الذي نحسبه قادرًا على أن يصبح مرجمًا 
معتبرًا ب البحث الرقمي 2# المخطوطات التراثية شريطة زيادة مخطوطاته كثيرًاء 
وشريطة المراجعة الدقيقة لبطاقات مخطوطاته؛ وإضافة السمات التقنية الحديثة 
اللازمة المبيّنة 4 الفصل الخامس لها أيضًا. يلاحظ ف جمع الجهدد المبذولة 
خ بناء قواعد بيانات خاصّة بخطوط العلماء؛ مدى قلة هذه الجهود: والحاجة 
الماسّة لتأسيس قاعدة بيانات رقمية لخدمة بحوث التعرف الآلي على الكاتب ب 
المخطوطات التراثية. 


ونظرًا لعدم قدرة أي من قواعد بيانات الرقمية للمخطوطات التراثية الموجودة 
حاليا على استيفاء حاجة الباحثين؛ فقد قام الباحث بعرض مقترح لمواصفات 
قاعدة بيانات رفمية مستقيلية للمخطوطات الإسلامية والغرفة: مع تحديد 
الخيارات والميزّات التي تمكن قاعدة البيانات المقترحة من خدمة باحثي العلوم 
الإسلامية وعلوم الحاسب الآلي معًا. تحتوي قاعدة البيانات المقترحة للمخطوطات 
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التراثية على مهام محدّدة مسبقًا تساعد ب تطوير البرمجيات الخاصّة بباحثي 
الحاسب الآلي: كالتعرف على الكتابة آليّاء والبحث عن صور الكلمات؛ وتحليل صور 
الوثاكقق»؛ ومعالجة اللغة الطبيعية: والتعرف على الكاتب والتحقق منه. ونتمنى أن 
تتواصل الجهود 2# الاتجاه المقترح لاستكمال بناء قاعدة بيانات رقمية للمخطوطات 
الترائية بالموصفات المطلوبة؛ حتّى يتسنّى للباحثين # علوم الحاسب الآلي تطوير 
بالواجب المرجو تجاه الأمّة. 
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شكر وتقدير 


يتقدم معد البحث بالشكر لمركز الملك عبد الله بن عبد العزيز الدولي 
لخدمة اللغة العربية لدعمهم لهذا المقال خاصّة وللغة العربية والدراسات اللغوية 
الحاسوبية عامّةً. ويذكر كذلك بوافر الامتنان كل من ساهم © إثراء هذا البحث 
من أفكار أو مراجعة أو معلومات قيمة؛ ونخصٌ بالشكر منهم الباحثين 2# العلوم 
الشرعية: الشيخ مشهور بن حسن آل سلمان: وسامي الأسعدء والباحث # العلوم 
اللفوية عماد السواعيرء والباحث 4# علوم الحاسب الآلي يوسف العريان. شكرنا 
أيضًا موجّه إلى جامعة القصيم لتوفيرها المرافق الحاسوبية. نسأل اللّه عزّ وجل 
أن يجعل عملهم خالصًا لوجهه. 
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استقصاء تقنيات معالجة اللفات الطبيعية وتطبيقاتها 4 
اللغة العربية 


3 


د.امجد أبو جبارة 8 


.111 ا زسسرة 


إ) شركة مايكروسوفت 


حصل أمجد أبو جبارة على درجتي الماجستير و الدكتوراة ‏ تخصص معالجة اللغات و استرجاع 
المعلومات من قسم هندسة وعلوم االحاسوب بجامعة ميشيجان الأمريكية 2 العامين 004 و 
01 كما حصل على درجة البكالوريوس 2 هندسة الحاسوب من الجامعة الإسلامية خخ 
فلسطين # العام .7٠00‏ يعمل حالياً كباحث تطبيقي # مجال تطوير محركات البحث 4 شركة 
مايكروسوفت الأمريكية . تشمل اهتماماته البحثية حاليا تقنيات استرجاع المعلومات و معالجة 
اللغات» و تطبيقات تعلم الآلة. 
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ملخص 


يهدف هذا البحث إلى التعريف بمعالجة اللغات الطبيعية ( -80.آ 21261181 
8 وق3ناع ) باعتبارها أحد أهم مجالات علوم الحاسوب المتفرعة عن 
مجال الذكاء الاصطناعي (411156121 11186566ء151) وباعتبارها تمثل نقطة 


التقاء بينه وبين مبحث اللغويات ( 128510115]165آ ) . 


يسلط البحث الضوء على الجهود البحثية التي تستهدف اللفة العربية 
اعد يدم من فيا رونا كلعة المرنية من خصوصياك درم اليا حفن الاثنياء زها 
رع ها عند نقل التقنيات المستخدمة 2# اللغات الأخرى إلى اللغة العربية. 

يستعرض هذا البحث أهم الموضوعات الفرعية المندرجة تحت مبحث معالجة 
اللغات الطبيعية كتقطيع الكلام إلى وحدات: وتصنيف أقسامه؛ وإعراب الجمل؛ 
وفهم المعاني؛ وتوليد الكلام؛ إلخ. كما يستعرض الوظائف الأساسية التي ينبغي 
للباحثين © هذا المجال الإلمام بها ومعرفة التقنيات والطرق المختلفة لتنفيذها. كما 
يستعرضن البحث - أيضًاح أهم وأشهر التطبيقات التي تعتمد بشكل أساسي على 
تقئيات معالجة اللغات. 

يعتمد هذا البحث على عرض خلاصات ما ورد ف أهم الكتب والبحوث 
المرجعية 4 المجال» وعقد المقارانات والمفاضلات بين الطرق المختلفة التي اقترحها 
الباحثون وعرض نتائج تقييم العديد من هذه الطرق. 

يتضمن البحث كذلك استعراضًا مقتضبًا لأهم الأدوات والمكتبات البرمجية 
والمجموعات النصية والبيانية المستخدمة بشكل متكرر من قبل الباحثين. هذا مع 
ترك إشارة إلى كل مرجع وكل أداة حتى يستطيع القارئ المهتم اللجوء إلى المصادر 
للحصول على المزيد من المعلومات التفصيلية 4 كل موضوع. 
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.١‏ مقدمة إلى علم معالجة اللغات الطبيعية 

هوآحد علوم الحاسوب ويعتبر أحد فروع العلم الناتجة عن التقاء مبحثي 
الذكاء الاصطناعي واللغويات. فعلم الذكاء الاصطناعي يهتم بتطوير خوارزميات 
وتقنيات تجعل الحاسوب قادرًا على تحليل وفهم البيانات التي يستقبلهاء وقادرًا 
على توظيف هذا الفهم لاتخاذ قرارات ذكية وراشدة # ظروف وسياقات مختلفة 
-قد لا يكون تعرضب لها من قبل- دون أن يكون قد تمت تغذيتة بأوامر برمجية 


محددة تخبره ماذا يفعل ‏ كل ظرف [ ١‏ ]. 


أما علم اللغويات فهو العلم الذي يهتم بفهم مكونات اللغة. وأقسام الكلام, 
والعلاقات القواعدية والمعنوية بين تلك الأقسامء وأنماط التعبير. وطرق استخدام 
الألفاظ المختلفة 4# السياقات المختلفة: إلخ. 


وبالتالي فإن علم معالجة اللغات الطبيعية هو علم تطبيقي يُعني باستخدام 
تقنيات الذكاء الاصطناعي - وعلى رأسها تقنية تعلم الآلة - من أجل حوسبة 
المفاهيم النظرية الموجودة 4 علوم اللغويات الخاصة باللغات الطبيعية التي 
يستخدمها البشر ي التخاطب بحيث يصبح الحاسوب قادرًا على تحليل وتمثيل 
وتوليد النصوص المدخلة أو المكتوبة أو المنطوقة بتلك اللغات. 

وتدخل تقنية معالجة اللغات.؛# كثير من التطبيقات الهامة التي أصبحت 
تشغل حيزًا كبيرًا من الحياة اليومية لمستخدمي الكمبيوتر والإنترنت: ومن هذه 
التطبيقات: محركات البحثء والترجمة الآلية» والتلخيصص الآليء والإجابة الآلية 
عن الأسئلة: وأنظمة الإعلانات الذكية عبر الإنترنت: وتحليل المشاعر وقياس 
الرأي العام وتصنيف موضوعات الأخبارء وتنقية البريد الالكتروني من الرسائل 
الضارة» إلى آخر قائمة تطول من التطبيقات الهامة. 
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نبذة تاريخية 

علم اللغويات -والذي يستمد مجال معالجة اللغات أسسه النظرية منه- علم 
قديم جدًا يصل عمره إلى مئات السنوات أوريما أكثر من ذلك. أما علم معالجة 
اللغات الطبيعية فظهر بطبيعة الحال بعد وقت قصير من ظهور وانتشار الحواسيب 
إذ تعود أصوله إلى خمسينيات القرن الماضي عندما وضع العالم الشهير آلن تيورنج 
8" داك معيارًا يمكن من خلاله الحكم على ذكاء الحواسيب [ 5-7 ]. يتمثل 
هذا المعيار .غ4 اختبار يتنافس فيه الحاسوب مع إنسان على إجابة أسئلة يلقيها 
عليهما حكم باستخدام لغة طبيعية ودون أن يعرف الحكم من من المتسابقين هو 
الذي يجيب. يعتبر تيورنج 4# معياره هذا أن الحاسوب ذكيٌ بقدر كاف إذا كان 
الحكم كاجر ا عق ليق بين إجايات الإتساو وا تكابا ف الجحاسوي 2 7 


اللفة الطبيعية التي يتلقى فيها الأسئلة وأن يكون قادرًا على توليد الإجابات بلغة 
طبيعية كذلك. وقد شكل هذا التحدي أحد أوائل محفزات البحث # مجال معالجة 


وكان من أوائل التطبيقات التي انصب عليها اهتمام الباحثين # فترة 
الخمسينات والستينات من القرن الماضي فكرة الترجمة الآلية من لغة إلى لغة 
أخرى وكانت أولى التجارب التي نجحت نجاحًا مبدئيًا ب هذا المجال بحث صدر 
عن جامعة جورج تاون نجح فيه الباحثون .4# ترجمة قرابة 7١‏ جملة من اللغة 
الروسية إلى اللغة الإنجليزية [05-4]. ومن التطبيقات الأولى التي لاقت اهتمامًا 
أيضَا- أنظمة "احانة الأسئلة" ل كطخ دمناوع010 [ 7-1 | ثم أنظمة تحليل 
وفهم الحوار [5-4]: وأدوات تقطيع الكلام وتحديد أصنافه وإعراب الجمل -١٠١[‏ 
؟١]؛‏ ثم تطبيقات التلخيصى الآلي :]١14[‏ وأنظمة استرجاع البيانات [5١]؛‏ ثم 
تطبيقات تحليل المشاعر التي تزامن ظهورها مع انتشار شبكة الإنترنت ١7-١71‏ ]. 
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وقد كان التركيز# البدايات ينصب بشكل أساسي على تحديد مجموعة 
من القوانين التي يصوغها الباحثون بشكل يدوي (15036ممزشى 1116-6250 ) 
ويلقمونها للحاسوب 4 صورة برمجية حتى يتمكن من خلال تنفيذها من فهم 
أو توليد الكلام؛ وكان وضع هذه القوانين يتطلب من البحاثين فهما عميقًا للغة 
وقواعدها ومعاني كلماتها وكيف يمكن أن تتغير هذه المعاني 2# السياقات المختلفة. 

ولكن مع ظهور تقئيات تعلم الآلة عمنصستدع.آ عمنطءة]3 ةك أواسط الثمانينات 
ومع تطور سرعات وذواكر الحواسيب بدأ الاعتماد على وضع قوانين مصاغة 
يدويًا يتراجع بشكل تدريجي لصالح الطرق الإحصائية التي تترك للحاسوب 
مهمة استنباط أو تعلم القوانين بشكل آلي من خلال الاطلاع على كميات ضخمة 
من النصوص والبحث فيها عن خصائص وأنماط متكررة ذات مدلول إحصائي 
(كمجتىء الصقة بعد الموضوؤف يشكل متكرر ب اللقة العربية مكلا ) وهذا يغتي أنه 
لم يعد من المهم أن يكون لدى مطوري أنظمة معالجة اللغات فهم عميق وكامل لكافة 
قواعد اللغة ومعانيهاء وإنما يلزمهم امتلاك القدرة على تحويل النصوص إلى صيغ 
إحصائية تتمثل فيها أهم خصائص وأنماط اللغة المتكررة. 

مؤخرًا بدأت تظهر بحوث جديدة تتبنى طرق هجينة تعتمد على كل من 
القوانين المصاغة يدويًا والأنماط الإحصائية التي يتم تعلمها آليّا باستخدام 
تقنيات تعلم الآلة للحصول على نتائج أفضل. 
معالجة اللغة العربية 

ظهر الاهتمام بتقنيات معالجة اللغة العربية متأخرًا بقدر ملحوظ عن اللغات 
الأخرىء وكانت البدايات الأولى.ب# التسعينيات من القرن الماضيء وتناولت الأبحاث 
وقتها بعض جوانب اللغة كالتحليل الصرك 215:515مى 21ءئع10مطم:ه21 ١٠١-141‏ ] 
وتجذير الكلمات 516770108 ]”١[‏ والتمثيل الحاسوبي لقواعد النحو[؟؟]. 
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وتزايد الاهتمام بمعالجة اللفة العربية بشكل مطرد مع دخول الألفية 
الثانية, لاسيما مع تزايد الاهتمام بدراسة المنطقة العربية ولغتهاء وتوفرت أموال 
وافرة لدعم البحوث الخاصة بمعالجة اللغة العربية من جهات حكومية وجامعات 
ومؤسسات بحذية عالمية: كما نُظمت العديد من ورش العمل الخاضة بدراسة تقنيات 
معالجة اللغة العربية على هوامش المؤتمرات الكبرىء وتناولت الأبحاث # أكثرها 
نقل التقنيات المستخدمة لمعالجة اللغات الأخرى وتطبيقها على اللغة العربية بعد 
تكييفها وتحويرها لتتناسب مع خصوصيات اللغة العربية» ومن المهام الرئيسية 
التي تناولتها الأبحاث تقطيع الكلام؛ وتحديد أصناف الكلمات؛ والإعراب: وتحديد 
الروابط المعنوية بين أجزاء الكلام؛ ونسبة الضمائر إلى ما تعود عليه. كما تناولت 
الأبحاث العديد من التطبيقات الهامة كالترجمة الآلية بين اللغة العربية واللغات 
الأخرى [؟70-7]: والتلخيص الآلي [77-577]: وتحليل المشاعر واكتشاف الآراء 
[-5؟]. هذا بالإضافة إلى تناول جوانب بحثية تخص اللغة العربية كالتشكيل 


ويميز الباحثون بين ثلاثة أشكال للغة العربية [/"]: 

أولا: العربية الفصحى الترائية 418610 01255102[1) وهي اللغة المستخدمة 
ل النصوصى الدينية والنصوص التاريخية والكتب القديمة» وتعتبر اللغة العربية 
القديمة من أقدم أشكال اللغة التي حافظت على وجودها وانتشارها واستعمالها 
من قبل أعداد كبيرة من الناس بشكل يومي؛ ويعود الفضل 4# هذا إلى كونها لغة 
القرآن الكريم ولغة نصوص السنة النبوية التي يتداولها ويستخدمها المسلمون - 
الذين يمثلون أغلبية العرب- بشكل يومي خلال ممارستهم للشعائر الدينية. 

ثانيًا: العربية الفصحى الحديثة 418612 51820810 1100612 وهي اللغة 
الرسمية # كل الدول العربية» وتعتبر لغة ثانية 4# بعض الدول غير العربية؛ وهي 
اللغة المستخدمة #2 الكتابة الرسمية والتعليم والصحف ووسائل الإعلام. وتمتلك 


احردل 


الفصحة الحديثة نفس خصائص الفصحى التراثية من حيث قواعد اللغة وبناء 
الجمل وتصريف الكلمات وأصوات الحروف؛ ولكنها تختلف 2# كثير من الكلمات 
والتعابيرء حيث إن ثمة الكثير من الكلمات والتعابير الموجودة 2# العربية التراثية 
تراجع استخدامها كآ اللفة الحديثة. ودخلت على اللغة كلمات وتعابير جديدة 
مقتبسة من لغات أخرىء أو# إطار الاستجابة الطبيعية لمتطلبات التطور المع ربخ 
والحضاري. 


قالفًا: اللهجات العربية العامية و4:81 21316121 وتمشل اللغات المحلية 
المستخدمة # التخاطب اليومي بين الأفراد # المعاملات الحياتية المختلفة, 
وهي تختلف عن بنية وقواعد العربية الفصحى كما تختلف اللهجات العامية عن 
بعضها من نطاق جغر اك لآخر ومن بلد لآخر. وقد اشتهر بين الباحثين 2# اللفة 
العربية تمييز” لهجات رئيسية # العالم العربي: المصرية؛ والخليجية؛ والشامية, 
والمغاربية: والعراقية: واليمينية. وتوجد عدة تقسيمات أخرى. ولكن يعتبر هذا 
التقسيم أكثرها شيوعًا. وكل واحدة من اللهجات تندرج تحتها لهجات فرعية 
تختلف من منطقة إلى أخرىء كما تختلف بحسب المستوى الاجتماعي ومكان 
المعيشة: المدينة أم القرية أم البادية. 


وعليه فإن اللغة العربية تتمثل فيها ظاهرة يعرفها علماء اللسانيات ويسمونها 
"ازدواج اللسات" 98 رإرهي تعني أن أهل منطقة معينة يتحدثون لغتين بينهما 
اختلاف واضح من حيث القواعد وبنية الجمل والتراكيب وتصريف الكلمات دون 
أن يشعروا أنهم يتحدثون لغتين مختلفتين وإنما يتصرفون باعتبارهم يتحدثون لغة 
واحدة [58؟]: مما يوجد تحديات بحثية لا سيما 4 ما يتلعق بمعالجة النصوص 
المنشورة # وسائل التواصل الاجتماعي التي يكثر فيها الخلط بين العربية الفصحى 
واللهجة العامية [4غ"؟]. 
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؟. الوظائف الرئيسية 2 معالجة اللغات الطبيعية 

الفصول التالية من هذا البحث ستتناول المهام والوظائف الرئيسية التي يتكرر 
الاحتياج إليها 4 أنظمة معالجة اللغات؛ مع استعراض مقتضب للطرق المختلفة 
التي توصل إليها الباحثون للقيام بهذه المهام مع تسليط الضوء على الأبحاث 
التي استهدفت اللغة العربية بشكل خاص # كل من هذه المهام. كما يتضمن هذا 
الاستعراضص تبيانًا لبعض الوظائف والمهام الإضافية التي تلزم عند معالجة اللغة 
العربية واللغات الشبيهة بها على وجه الخصوص. 
تسوية الكتاية 21122616005دصها8 عتطمه ع م01 

وتعتبر هذه العملية من أول العمليات التي يتم إجراؤها على النصوص المكتوبة 
قبل البدء بمعالجتها بهدف التأكد من تنقية النص من الشوائب الكتابية كالرموز 
الزائدة وغتلامات الترقيم غَيْرالهامة لعملية المعالجة مخلاوكدلك من أجل التاكد 
من توحيد الأنماط المختلفة لكتابة الشيء الواحد. وقد تختلف إجراءات التسوية 
بحسب ما يحتاجه التطبيق. ولكن بشكل عام تتضمن إجراءات التسوية إزالة 
بعضن الرموز الغريبة التي لا فائدة من وجودها ثش النصء وتوحيد طريقة كتابة 
علامات الترقيم» وتحويل الحروف الكبيرة 15ع1اء.] 1181م02) 2# اللغة الانجليزية 
إلى حروف صغيرة 1.6]1615 550311 إذا كان التطبيق لا يحتاج إلى التفريق بينهما. 

وقد بينت بعض البحوث المتعلقة بمعالجة اللغة العربية أن إجراء عمليات 


التسوية على النصوص العربية له تأثير ملحوظ على جودة وكفاءة عمليات المعالجة 
اللاحقة للنص [55]. 

ومن أمثلة عمليات التسوية # اللغة العربية إزالة التطويل من الحروف التي 
يتم إضافة تطويل لها (عن طريق زر [+ #51116 الكيبورد مثل: ''سيارة" 
حيث يظهر فيها طول زائد لحرف الياء) .]4١[‏ ومن الأمثلة أيضًا توحيد طريقة 
كتابة الحروف التي يكثر وقوع الخلط فيها 2 اللفة العربية كالهمزة ( الخلط بين 
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الوصل والقطع؛ والخلط بين الهمزة على ألف حال كونها مفتوحة أو مضمومة - 
حيث تكون الهمزة أعلى الألف- وحال كونها مكسورة - حيث تكون الهمزة أسفل 
الألف - ): كذلك الخلط بين الألف المقصورة والياء» وبين الهاء والتاء المربوطة. 
فيتم توحيد كتابة كل هذه الحروف بتحويل كل حالة يحصل فيها خلط إلى صورة 
موحدة # كل النص. ومن أمثلة عمليات التسوية كذلك إزالة التشكيل (خاصة أ 
حال كونه موجودًا لبعض الحروف أو الكلمات فقط دون أخرى) . 


النسخ الحريك 2100رء]ناقمهة:1” 
ويقصد بالنسخ الحرخ كتابة الكلمة باستخدام حروف لغة أخرى غير اللغة 

الأصلية للكلمة عن طريق تحويل كل حرف إلى حرف أو أكثر يقابله 2# اللغة الأخرى 
وغاليًا ما يكون لفظ هذا المقابل قريب من لفظ الحرف الأصلي 2# اللغة الأصلية. 
من أمثلة ذلك تحويل الحرف "ب" # اللفة العربية إلى "6" أوتحويل الحرف 
ق ان ٠‏ 

ويقصد بالنسخ الحرك أ سياق معالجة اللغات كتابة نص لغة ما باستخدام 
رموز ال45011 والتي تقتصر على الحروف الانجليزية الصغيرة والكبيرة والأرقام 
وعلامات الترقيم وعدد من الرموز الخاصة الأخرى.ء يتم اللجوء إلى النسخ الحرا 
تقنيات معالجة اللغات لأسباب عديدة منها وجود أنظمة حاسوب ولغات برمجة 
لاتدعم سوى ترميز ال 450011, ولا تدعم الترميز العالمي 172160006 الذي يدعم 
حروف كل اللغات. وحتى 2# الحالات التي يتوفر فيها الترميز العالمي فمازال العديد 
من الباحثين الذين يتعاملون مع لغة غير لغتهم يلجأون إلى استعمال النسخ الحرب 
لتسهيل التعامل مع اللغة الغريبة عنهم. 


واللفة العربيةواحدة من اللفات التي يستعمل فيها النسخ الحرج بشكل 
متكررء وأكثر قواعد النسخ الحرخ المستخدمة من قبل الباحثين الأجانب هي 
طر يقة مه ونه )1 أممم1 رع اله كاعن8 [؟: ]. أوأحد الطرق المبنية عليها (مثال 
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111 -113865-50101 [؟: ]) . ووفق طريقة تحويل 8110165214615 يكون 
لكل حرف عربي ما يقابله (قد يكون حرف أو أكثر أوحرف ورمز) # ترميز ال 
661 فخا كلمة ع" تنسخ حرفيًا إلى '" مقصةة ' ''؛ وكلمة "كان" تنسخ 
إلى "124828" وهكذا. ويكون التحويل لكل كلمة تحويلا فريدَ ا بحيث يمكن عكس 
عملية التحويل لاستعادة الكلمة الأصلية كما هي. 


ونحيل المطورين المهتمين بتطوير وبرمجة أدوات معالجة اللفغة العربية إلى 
ال 17016006 الى ترميز 450011 وفق طريقة 811155721161 وبالعكس. بالإضافة إلى 
هذا فإن الواجهة البرمجية (8721) المرفقة ب" المجموعة النصية العربية القرآنية" 
تتضمن برنامجًا يقوم بنفس المهمة باستخدام طريقة مشتقة من طريقة -181101 
:1 بعد إدخال تغييرات طفيفة عليها [ 5 ]. 


تقطيع الكلام 101021226100 

وتسمى هذه العملية أيضًا بالتحليل اللفظي 4217515 1.671021» ويقصد به 
تقطيع النص إلى وحدات 5 تتكون كل وحدة منها من أحرف أو أرقام أو 
رموز متصلة كالكلمات أو الأعداد أو علامات الترقيم؛ مع تحديد موضع بداية 
ونهاية كل وحدة. وتختلف درجات التقطيع التي يتم إجراؤها على النص بحسب 
ما يتطلبه التطبيقء ومنها '"التقطيع البسيط" وغالبًا ما تستخدم فيه التعبيرات 
النمطية 11016551025 116810131 لتقطيع النص إلى الوحدات التي تفصل بينها 
المسافة 206م11/1165 أونهاية السطرء كذلك يتم فصل علامات الترقيم عن 
الكلمات ( كالفاصلة المتصلة بالكلمة). بحيث تصبح الكلمة وحدة وعلامة الترقيم 
وحدة أخرى منفصلة عنها وكذلك فصل الأرقام عن الكلمات إذا كانت متصلة 
بهاء وكذلك فصل بعض أدوات الربط التي قد تتصل بالكلمات أحيانًا كما يذ اللغة 


الغربينة قلا ين يتصل جرف العظف "و" بالكلمة التي طلية كينا ف كثير من 


فل 


النصوصى العربية. وقد تشمل عمليات التقطيع البسيط إزالة بعض الرموز الغريبة 
أو استبدالها كلها برمز واحد بهدف تقليل درجة التشويش 20156 24 النص. 

وقد تتطلب بعض التطبيقات عملية ''تقطيع متقدم'" تذهب إلى أبعد من مجرد 
تقطيع النص إلى كلمات تفصلها مسافة 86م11/1465 [ 51-440 ]؛ وفيها يتم تقطيع 
الكلمة نفسها إلى وحدات أصغر إذا كانت الكلمة ناتجة عن تركيب عدة مكونات 
كدخول "ال" التعريف على الكلمة أو الضمائر المتصلة كما اللغة العربية. و 
هذه الحالة تتطلب علمية التحليل إجراء تحليل صرية -:213مكى 501081221م2/101 
5 للنصص للتعرف على المكونات التي تتركب منها الكلمات حتى يكون من الممكن 
تقطيعها على هذا النحو. 


الشكل:١‏ يوضع مكالا لجملة باتلقنة العربية ونقيجة قطيسق] خطيعا بسيطا 
وتقطيعًا متقدمّاء وتوجد بين هذين المستويين من التقطيع مستويات عدة يتم اللجوء 
إلى ما يناسب التطبيق من بينها [07]. 
سيلف المذير كلمة 5 وستضاوق: كلمتة :شير كا للحظة الجديية: 


| تقطيع بسيط | سيلقي | المدير | كلمة | . | و| ستتناول | كلمته | شرحًا | للخطة | الجديدة | . 
تقطيع متقدم | س | يلقي | ال | مدير | كلم | ة | ٠‏ | و | س | تتناول | كلم | ة | + | شرح | ل | ال | خط | 


شكل١‏ : مثال يوضح كيفية تطبيق عمليات التقطيع البسيط والمتقدم على نص عربي. 


جدير بالذكر أن عملية تقطيع النص -حتى 2# أبسط أشكالها- تعتبر عملية 
صعبة ومعقدة للغاية 2 اللغات التى لا تستخدم فواصل محددة بين الكلمات ومن 
أمثلة هزه اللغات اللغة الصينية واليونانية التراثية واللغة التايلاندية وغيرها. 

ومن الأدوات التي يمكن أن يستعملها الباحثون والمطورون لتقطيع النص 
العربي أداة 71016411 [47]؛ وهي تحتاج إلى إجراء تحليل صرئ للنص حتى 
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تتمكن من تقطيعه: وهو ما توفره أداة 114104 وهي متاحة مع 1016411 كباقة 
واحدة للتحميل من []؛ وتحتوي الباقة -بالإضافة إلى المحلل الصر والمقطع- 
على أدوات أخرىء. منها أداة لتسوية النص 71011211226100 عنطم همع هط0.: وأداة 
لتحويل النصوص العربية الى ترميز 45)011 وفق طريقة 8110167731161 كما شرحنا 
4 الفصل السابقء وغير ذلك. 


ومن الأدوات المتاحة أيضًا 41/111:4-17016 وهي إحدى الأدوات التي تتضمنها 
باقة 41/1114 [45] التي تضم أدوات لتنفيذ العديد من المهام الأساسية # معالجة 
اللغة العربية» وهي متاحة للتحميل من [ 5٠‏ ]؛ وتصل دقة التقطيع 4 :41/111 إلى 
1 - 244,7 مع العلم بأن التقطيع الذي يجريه البرنامج لا يتعامل مع كل حالات 
التصريف وبالتحديد ما كان داخليا كال 1010877م2/101 110221ء16لم1. 


التحليل الصريك 21:515ك 21ع01051م1/101 

يقصد بالصرف (00108م1101 تحويل الأصل أو الجذر من الكلام إلى أبنية 
وأشكال مختلفة تحمل دلالات معنوية مرتبطة بمعنى الجذر. ومن أشكال الصرف: 
الجمع والتثنية والتأنيث واسم الفاعل واسم المفعول والصيغ الزمنية للأفعال: 
مضارع وماضي وأمرء وصيغ المبالغة: إلخ1١0].‏ ومثال على ذلك # اللغة العربية 
الجذر "ذهب" الذي يمكن أن يأتي # التصريفات التالية: "يذهب" و"يذهبون" 
و"يذهبان" و"تذهبان" و"الذاهب" و"الذاهبون" و"الذاهبات" ... إلخ. 

وتهدف عملية التحليل الصرك للكلمات إلى دراسة بنية الكلمة بفرض التعرف 
على القسم الصرك لهاء كتحديد هل هي جمع أم مفرد. صيغة تذكير أم تأنيث, 
صيغة ماض أم مضارع أم أمر للأفعال ... إلخ؛ كما تهدف إلى تحديد جذر الكلمة 
وتحديد الزوائد التي أدخلت على الجذر. 


١ 


ويميز الدارسون لعلم التحليل الصري بين نوعين من التحليل [ 1" ] : 

أولا: تحليل معتمد على النوع أو الشكل زع 1010م2/101 1012-6350 : ويقصد 
بهتحديد مجموع "المورفيمات" 9ه م0 المكونة للكلمة وأنواعها. و"المورفيم" 
هو أقل لفظة خ اللغة تفيد معنىّ متضمنًا فيها (قد تكون جزءٌ من كلمة - كضمير 
تقصل مكلا ) دروالمورغيمات التق تتكون متها الكلبات تشمل الجدع ها مكل "كتنب" 
كلمة ' تكتبين" ؛ والاضافات السابقة 5685م مثل '"التاء" التي تدخل على 
الجذع للدلالة على كون الفعل مضارع للانثى الغائبة أو المذكر المخاطبء والإضافات 
اللاحقة 511365 مثل ين" فتصبح الكلمة كفنين” للدلالة على توجيه خطاب 
للأنشى ك# صيغفة الفعل المضارع. والإضافات الداخلية 186:68 كدخول الألف 
على الفعل فتحوله إلى صيغة اسم الفاعل كما ف "كتب" - "كاتب' ؛ ويعتبر من 
المورفيمات أيضًا الزوائد التي تحمل خصائص كلمة منفصلة ولكنها تأتي متصلة 
مع الكلمة 4# الكتابة مثل "أل" التعريف والضمائر المتصلة مثل "هم" 2 '"كتابهم' . 

ثانيًا: تحليل معتمد على الوظيفة (10108م2/101 110001105-62560: ويقتصد 
بها تحديد الدور الإعرابي والدلالة المعنوية التي تنتج عن دخول كل مورفيم على 
الكلمة. وتنحصر وظائف المورفيمات المختلفة 2# ثلاثة أنواع ركيسية: 


أولا: تصريف اشتقاقي لاع 10مطم7101 12611120021: ويقتصد به أن دخول 
الؤوقيية ا ع طني القلية يطل بها قو ةجمديرة افكلة "حافس" أغيلها "عن ' 
ودخول مورفيم زائد عليها جعلها تعنى مكان الصلاة 4# المعنى الدارج للكلمة: 
و"جامعة" كذلك أصلها "جمع" ودخل عليها مورفيمان فأصبحت تعني مكان 
للتدريس خ المعنى الدارج للكلمة. 


ثانيًا: تصريف إعرابى 11010501087 121166110281: ويقصد به دخول 
المرفيمات على الكلمة بغرض تحديد الزمن,ء أو الجنسء أو حالة الخطابء أو العدد 
كما أوضحنا 4 الأمثلة السابقة. 
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الفا تصريف إلحاقي 1010857م7101 01117260: ويقصد به أن يلحق 

بالكلمة مورفيم يحمل الخصائص المعنوية والإعرابية للكلمات المنفصلة. وضربنا 

آنمًا مثال دخول أل التعريف على أول الكلمة أو أحد الضمائر المتصلة على آخرها. 

الشكل ١‏ يوضح نظام الاشتقاق والتحويل بين الكلمة وجذعها وجذرها ودور 
عمليات التصريف 4# هذا الاشتقاق [07]. 
توليد صرفي 


تطبيق أنماط التحويل إضافة ملحقات 


تحديد نمط التحويل إزالة ملحقات 


2 


شكل ؟ : نظام الاشتقاق الصريك والعلافة بين الكلمة وجذعها وجدرها 


ولعلم الصرف # اللغات المختلفة قواعد وقوانين تضبط عمليات الصرف 
وتحدد أشكال وأنواع الصرف التي تصلح لكل سياق وطريقة تنفيذ هذا الصرف. 
وبقدرما تكون هذه القواعد قليلة ومحددة تكون حوسبة التحليل الصرخ أسهل. 
وتعتبر اللفة الانجليزية مثلّا من اللفات التي لها نظام تصريف سهل. ا حين تعتبر 
اللغة العربية من اللغات الغنية من الناحية الصرفية بمعنى أن هناك الكثير من 
الأشكال والآبنية الصرفية التي يمكن تكوينها من الجذر الواحد مقارنة بمعظم 
اللغات الأخرى.ء وهناك الكثير من القواعد والقوانين التي ينبغي مراعاتها عند 
تصريف الكلمات. ولذلك يعتبر التحليل الصريخ من أبرز وأهم المهام التي يُعنى 


١ / 


بها الباحثون غ مجال معالجة اللغة العربية [17] ولذلك تجد أن بحوثًا كثيرة 
قد تناولت هذه الجزئية (أمثلة:[70. 04-407]) واقترحت طرق متعددة لإجراء 
التحليل الصرخي للنصوصى العربية. ويمكن للقارئّ المهتم أن يرجع إلى أحد 
الاسقصاءات المنشورة 4 هذا الموضوع والتي حصرت الطرق المختلفة وقارنت 
بينها (مشال:[07]). حيث اقترح المؤلفون تصنيف الطرق المختلفة لحوسبة 
عمليات التحليل الصرك إلى أربعة أقسام: 


أولا: البحثة جدول شامل 0150361مزشى منءا00.] 186016: وفيها يتم تخزين 
كل الكلمات العربية الممكنة # جدول كبير يحتوي أيضًا تفكيك كل كلمة إلى مكوناتها 
من المرفيمات. هذه الطريقة تحتاج إلى جهد بشري كبير لبناء هذا الجدول. 

ثانيًا: الطريقة اللغوية 10261مى عاذ نناع صن آ: وفيها يقوم خبراء 4# اللغة 
وقواعد الصرف فيها بصياغة مجموعة من القوانين التي تحكم عمليات الصرف 
لأكبر عدد ممكن من الكلمات. ويتم تغذية الحاسوب بهذه القوانين حتى يستخدمها 
لتحليل الكلمات [00]. 

الفا طريقة التوافيق :103612م2ش 0215172101121): و4 هذه الطريقة يتم 
تجريب كل المجموعات التي من الممكن تشكيلها من حروف الكلمة؛ ويتم بعد ذلك 
مقارنة كل مجموعة من تلك المجموعات بقائمة شاملة بالجذور العربية 210015 
وقوائم للملحقات وع كيه [ ده -ل/اه ]. وهذه الطريقة مكلفة من حيث احتياجها 
لطاقة حوسبة أعلى حتى تتمكن من اختبار كل المجموعات الممكنة 4 وقت معقول. 

رابعًا: طريقة الأنماط داعةه:1ممركى 231610-52560: وتعتمد هذه الطريقة على 
تحديد عدد من الأنماط المتكررة 4# الكلمات العربية من حيث التركيب الصربذ 
وتطبيق هذه الأنماط على الكلمات من أجل تحليلها [/0]. 


ونحيل القارئّ المهتم إلى المصادر المشار إليها إ هذا الفصل للتعرف أكثر 
على الطرق المستخدمة # التحليل الصرك للكلمات العربية. 
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ومن أدوات التحليل الصرك المتاحة للباحثين والمطورين باقتا 1/4104 و 
43114 اللتان تمت الإشارة إليهما # الفصل السابقء ومنها أيضًا 8481/4 
(عاطومك نع اماع81 مء772[دمث 1دء1ع5010م6101) [41,59] وذ الخد (حمماد 
11خ 012310 نمء2157:2مث 21ه010512طم1/101) 1 . 1 وهو مبني على 1524.14 إلاإنه 
لوقو مجان بان 


ومن الأدوات أيضًا 1511111301 ويتوفر له عرض لتجريبه من خلال واجهة 
يمكن تشغيلها عبر المتصفح [11]ء كما أنه متاح للتحميل المجاني [17]. 
التجديع 51611111128 

هي عملية يتم إجراؤها على الكلمة وتهدف إلى تحويل الكلمة إلى صورة 
أبسط بحيث تكون أقرب ما يمكن إلى جنع أو جذر الكلمة وذلك من خلال إزالة 
الزوائد الصرفية التي تدخل على أصل الكلمة. فمثلا جذع كلمة 0012011161 2 
اللغة الإنجليزية هو ]6012711: وكذلك جنع كلمة 017181011108© هو ]11م0011: ومثلهم 
أَيكَننا كلمات 6012011160 و 601222111615 و 60122111261052 كل هذه الكلمات لها جذع 
واحد هو غ2010امه. ونلاحظ هنا أن 114م2اه» 4# حد ذاتها ليست كلمة صحيحة 3 
اللغة الانجليزية وليست هي الجذر الذي اشتقت منه الكلمات الأخرى ولكنها قريبة 


جدًا من الجذر. 


وتقوم عملية التجذيع هذه على افتراضن أن الكلمات المشتقة من نفس الأصل 
تحمل نفس المعنى أو معاني متقاربة جدًا # الغالبية العظمى من الحالات؛ وعليه 
فإن الهدف الأساسي من عملية التجذيع هو تحويل كل كلمة ب النص إلى أقرب ما 
يمكن من أصل هذه الكلمة بحيث لا يعود هناك اختلاف بين 101161م6011 و-أنام جام 
5 0]1853ا0011: وعند مقارنة النصوص لاحتساب مدى تشابه نص مع نص آخر 
يتم التعامل مع كل هذه الكلمات على أنها كلمة واحدة. 


١ 


ويتم اللجوء إلى عملية التجذيع ب كثير من تطبيقات معالجة اللفغات. ومن 
أمثلة ذلك عمليات الفهرسة 1206108 التي تقوم بها أنظمة استرجاع المعلومات 
16116131 11101111361012 كمحركات البحث وما شابههاء فأنت عندما تبحث عن 
كلمة 114615م0112© عبر أحد محركات البحثء فلن يكون من الخطأ أن يعرض لك 
محرك البحث نتائج فيها كلمة 5ه ]ناطتط00 أو 8ه أنامدمه0 [ 15-77 ]. ومثل ذلك 
أيضًا التطبيقات التي تحتاج إلى احتساب مقدار التشابه بين النصوص.ء كتطبيقات 
تصنيف النصوص 0135515086108 164'؛ وتطبيقات تجميع النصوص المتشابهة 
8 100 , وكذلك تطبيقات كشف النسخ 4# المنشورات -6(آ] 21381211512 


ع6 1. 


وتعتمد أغلب خوارزميات تجذيع الكلمات على مجموعة من القواعد والقوانين 
المعدة بشكل يدوي؛ وتختلف هذه القواعد من لفة إلى لغة؛ ولكن الرابط المشترك 
بينها كلها أنها تحاول أن تزيل الزوائد الصرفية التي تدخل على الكلمة. ويعتبر هذه 
النوع من الخوارزميات الأشهر والأكثر استخدامًا بسبب سهولة تطبيقه وسرعة 
تشغيله على النصوص وعدم حاجته إلى قوائم كلمات أو قواميس. وتعتبر خوارزمية 
1 التي اقترحها 20111 1/1310 (عام )٠‏ أشهر هذه الخوارزميات للغة 
الانجليزية ومازالت مستخدمة على نطاق واسع حتى اليوم [10]. 

وهناك مجموعة أخرى - ولكنها أقل شيوعًا- من خوارزميات التجذيع تعتمد 
على رصد خصائص إحصائية للكلمات. وذلك من خلال إيجاد الكلمات المتشابهة 
التي تظهر معًا بشكل متكرر # النصوص ال مختلفة ثم اختيار الكلمة الأقصر من 
بين كل هذه الكلمات لتكون هي الجنذع الذي ترد إليه كل الكلمات الأخرى [77- 
]. ولكن هذه الطريقة تحتاج إلى توفر كميات كبيرة جدًا من النصوص تكفي 
لاحتساب علاقات إحصائية ذات معنى بين الكلمات. والميزة الأساسية لهذا النوع 
من الخوارزميات هو قدرته على تجذيع التصريفات الغير قياسية مثل 1004 و1561 


لجال 
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وهوما تفشل الخوارزميات المعتمدة على القواعد المصاغة يديويًا 2 التعامل معه. 
الميزة الاخرى لهذا النوع من الخوارزميات هو أن الخوارزمية نفسها يمكن تطبيقها 
على أكثر من لغة. # حين أن القواعد المصاغة يديويًا تختلف بحسب اللغة وتحتاج 
إلى خبير لغوي حتى يتمكن من تحديد تلك القواعد. 


اللفة العربية تعتبر من اللغات التي يصعب تطبيق التجذيع فيها لعدة أسباب 
أهمها الثراء الصرخ لها وكون الزوائد الصرفية تدخل على الكلمة 4# أولها 
ووسطها وآخرهاء مما يجعل صياغة قواعد للتجذير عملية صعبة ومعقدة جدًاء 
هذا بالإضافة إلى الجدل بين الباحثين حول درجة التجذيع اللازمة # اللغة العربية 
بحيث تحقق ما تحتاجته تطبيقات استرجاع المعلومات أو تصنيف النصوص بين 
من يرى أن الاقتراب من صورة الجذع يكفي وبين من يرى ضرورة إيجاد جذر 
الكلمة الثلاثي أو الرباعي [14]. 


وقد اقترحت عدة طرق لتجذيع الكلمات العربية منها ما يعتمد على قوائم 
معدة يدويًا تحتوي كل كلمة وجذعها ( أو جذرها) [15-74].؛ ومنها ما يعتمد على 
صياغة قواعد شبيهة بما تقوم به خوازمية :0116م 4# اللفة الانجليزية (مثال 
[548]): ومنها كذلك ما يعتمد على الطرق الإحصائية [ ١-07١‏ ]. 

ومن أدوات التجذيع المتاحة للاستعمال من قبل الباحثين والمطورين آداة 
م 3 زمط1 71 ] التي تستخدم مجموعة من القوانين المصاغة يدويًا 
لحذف الزوائد. ومجموعة من الأنماط والقوائم لاستخراج الجذع ( أو الجذر). 
تأصيل الكلمة 11126:22600ه.آ] 

وهي عملية شبيهة جدًا من حيث الهدف بعملية التجذيع 0128تدا»]5 ولكنها 
تختلف عنها من عدة نواحي أهمها أن الأصل الناتج عن العملية هو كلمة صحيحة 
اللفة وتكون 2# الغالب هي أبسط شكل للكلمة: ففي المثال الوارد # الفصل 


السابق» فإن أصل كلمة 15ع]1ام0012 و1]6ام0122ه ( قارنه بالجذع 114م0052) . الفارق 
الآخر هو أنها تقوم بتحويل الكلمة إلى كلمة أخرى إذا استدعى الأمر ذلك بشكل لا 
تستطيع أغلب خوارزميات التجذيع القيام به. مثال ذلك تحويل 15 و3156 ولحتتقة إلى 
6 وكذلك 1ع]ء6 الى 8000 وهكذا. 


وتعتمد أغلب خوارزميات تأصيل الكلمات على استخدام قوائم بالكلمات 
المختلفة وأصولها مع دمج ذلك مع بعض القوانين البسيطة لجعل حجم تلك القوائم 
أضنمن: 
تصنيف أقسام الكلام عمزوعها تاءءءمهة 04 نوم 

وهي واحدة من العمليات الأساسية اللازمة للكثير من تطبيقات معالجة 
اللفات. ويتم فيها تصنيف كل كلمة 4 النص بحسب حالتها الصرفية وبحسب 
سياقها الإعرابي. كتصنيف الكلمة كفعل ماض أو اسم بصيغة الجمع أو أداة عطف 

والصعوبة الأساسية # هذه العملية تكمن ‏ ضرورة أخذ السياق الذي ترد 
فيه الكلمة ْ عين الاعتبار وذلك بسبب الفموض الذي يكتنف بعض الكلمات إذا ما 
عوملت منفصلةًٌ عن سياقها. مثال لذلك © اللغة العربية كلمة "ذهب" غفي بعض 
السياقات هي اسم معدق كتين و سيافات أخرى هئ دل اسن للمغود العاكب. 


يعرض شكل ؟ مثالين أحدهما باللفة الإنجليزية والآخر باللفة العربية 
يوضحان نتيجة تطبيق عملية تصنيف أقسام الكلام على النص. الرموز الظاهرة 
4 المثالين مثل 782 و2121 و3211 وغيرها تسمى 1385 وكل منها يرمز إلى 
أحد أقسام الكلام داءءءم01-5-انة]1 فمثلا 2 تشير إلى الفعل المضارع للمفرد 
اللغة الإنجليزية. 
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221 عمقتادء 5عع11! 2150 مهد 3/137 


117 الأدعمط تا 78 /عصتنوء 787ا/وعك1لن[ 150/118 1الالمه5 1105[ ط نوالا ./. 


تعجبني الأفكار الإبداعية ويسعدني أن أساهم في إلجاحها 


تعجبني/7782 الافكار/1717171 الابداعية/117111 و/00 يسعدني/1782 ان/111 
اساهم/1782 في/121 انجاحها/ن0]0121/. 12لا 


شكل ": نتيجة تطبيق عملية تصنيف أقسام الكلام على جملة إنجليزية 


وأخرى عربية 


ويتم تعريف الأقسام داءعءءم5 2315-02 التي يتم تصنيف الكلمات إليها من 
قبل علماء اللغويات: الذين يعرفون مجموعة من الأقسام تسمى 13856]1'. ولكل لغة 
من اللغات أصناف مختلفة من الكلام تختلف بحسب الثراء الصري والقواعدي 
لتلك اللغة. كما أن اللغة الواحدة قد يلجأ العلماء فيها إلى تعريف أكثر من -788 
561 تختلف لش درجة تفصيلها. فمثلا أبسطغ]12856' 4 اللفة العربية ممكن 
أن تحتوي ثلاثة أقسام فقط: اسم وفعل وحرف. 2# حين أنه من الناحية النظرية 
ممكن تعريف عدد قد يزيد على 7701٠٠١‏ قسم! 

ومن أشهر التقسيمات المستعملة 4 اللفة العربية 4ء1885 81101501612 
بصورتيها المخصصة للكلمات المقطعة 1012601260 ( وهي الأكثر شيوعًا وتضم 
قرابة 000 قسم) وغير المقطعة 118401601260 وتصل أقسامها إلى عشرات 
الآلاف. و حالة تقسيم الكلام 10160128108 فإن الكلمة الواحدة تنقسم إلى 
مكوناتها الصرفية وكل من تلك المكونات يكون تابعًا لقسم مختلف. 

هذا بالإضافة إلى العديد من التقسيمات الأخرى التي حاول بعضها اختصار 
811177211615 بهدف تقليل عدد التقسيمات وتسهيل عملية التصنيف 
[عبحتك"]. 
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وتستخدم معظم خوارزميات تصنيف أقسام الكلام حاليًا تقنيات تعلم 
الآلة. وذلك من خلال إعداد كمية كبيرة من النصوص والاستعانة بخبراء ب 
اللغة لتحديد القسم الذي تتبع له كل كلمة ف النصء ثم يتم استخدام هذا النص 
المصنف لتعليم خوارزميات تعلم الالة كيفية إجراء التصنيف لنصوص جديدة غير 
تلك التي تعلمت منهاء ومن أشهر تقنيات تعلم الالة المستعملة هنا: 1/27 مع11100 
5 تزمعا [ /الا-م" ] وولاء11 مدمكمهظ لمصمقتلمهك [ 7/5 ] . 


وغاليًا ما تسمى المجموعات النصوصية المستعملة 4# تعليم خوارزميات تعلم 
الآلة على تصنيف أقسام الكلام والإعراب وما شابههما ب 11665815 : ومن أشهر 
هذه المجموعات # الإنجليزية ال""اموطاءه؟1' صدءط ومن أشهرها 2# اللغة العربية 
علتقطء1 عتطوعم مم00 , 


ومن أدوات تصنيف أقسام الكلام المتاحة للمطورين أداتا 4خ11]الك و 
14خ وقد سبقت الإشارة إليهما ‏ فصول سابقة. ومنها أيضًا -ع0.آ 510014010 
0 دعععم 2311-01-5 112631 و الذي تصل دقته إلى 571,6 على النصوص 
العربية [60] و يعتبر من أفضل الأدوات المتاحة و أسهلها 2# الاستخدام: كما أنه 
يدعم لغات أخرى. 
التشكيل الآلي 1012011122605 هناك 

وهي من الوظائف المهمة # اللغة العربية» وذلك لأن نطق أحرف اللغة العربية 
يختلف باخت لاف تشكيل الحرف, وتختلف تبعًا لذلك المعاني والبنية الإعرابية 
للجملة والعديد من الخصائصى اللغوية للنصص. ومع ذلك فإن أغلب النصوص 
العربية المنتشرة خ الكتب وعلى الإنترنت تخلومن التشكيل إما كليا أو جزئَيّاء أما 
النصوص المشكلة تشكيلا كليّا فهي نادرة جدًا. 


علطو عع ,نالع ططع جنا.كك.0107017ك/ ر:صاخط2 (1) 
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الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


وهذه الظاهرة ك اللفة العربية تتسبب 2# حالة التباس كبيرة تجعل من 
الضروري الاعتماد بشكل أكبر على السياق لفك الالتباسات. ومن أشهر التطبيقات 
التي يعتبر توفر التشكيل فيها أساسيًا وضروريًا: توليد الأصوات العربية 41816 
5 506601 : حيث يكون من الضروري تحديد تشكيل كل حرف 2# الكلمة 
حتى تتمكن آلة توليد الصوت من إخراج الصوت المناسب للحرف. وكحل لهذه 
المشكلة اقترحت بعض البحوث بناء أنظمة لإضافة التشكيل الآلي: وأغلب هذه 
الطرق تعتمد على تقنيات تعلم الآلة أو تقنيات هجينة تجمع بين تعلم الآلة وبين 
القواعد المصاغة يدويًاء وتستخدم أغلب هذه الطرق خصائص لفظية 61021.آ 
وخصائص صرفية 1410101081631: وخصائصن نحوية 5370120110 لتدريب 
خوارزميات تعلم الآلة على إجراء عمليات التشكيل الآلي. ومن أمثلة الأبحاث التي 
تناولت الموضوع ونحيل القارئ المهتم إلى مطالعتها: [1/-65]. 


وتصل دقة أنظمة التشكيل الآلي إلى؟, 8/8 وذلك 4 تحديد تشكيل نهايات 
الكلمات كما كي الطريقة المنشورة 4[ 84] التي تستخدم تقنيات التعلم العميق 
هه مع102 لتنفين المهمة. 


كما تتضمن باقة 718104 التي أشرنا إليها سابقًا أداة للتشكيل الآلي تصل 
دقتها 4 كشف حركات نهايات الكلمات إلى ١‏ , 704 ويمكن للباحثين و المطورين 
استعمالها. 


تحليل البناء النحوي ع10اونه2 570192116 

وتهدف هذه العملية إلى كشف بنية الجملة؛ وتحديد العلاقات النحوية بين 
الكلمات والعبارات .2# الجملة؛ كتحديد الأقسام البسيطة التي تتكون منها الجمل 
المركبة وأدوات الربط بين تلك الأقسام؛ مثال ذلك الجمل التي تحتوي على شرط 
وجواب شرط وأداة شرط تربط بينهما. وكذلك تحديد الكلمات التي تكون معًا 
عبارة اسمية 2121856 7101112 أو عبارة فعلية 17356 1/615. وغالبًا ما يتم تمثيل 
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هذه العلاقات + صورة شجرة جذرها 4# الأعلى ويمثل كل تفرع من تفرعات 
الشجرة قسم من الجملة: كما تمثل كل ورقة من أوراق الشجرة النهائية كلمة من 
كلمات الجملة أو علامات الترقيم فيها (والقسم داءعءءم5 31601 الذي تتبع له) . 
التقداكل الوا هار ذه الشهورة تبكل يتن نعو 5 ف التحملة كش را الشقطلة 5 تين 
جملة,؛ والنقطة ١/2‏ تمثل جملة فعلية: والنقطة 518/41 تمثل جملة تابعة كجملة 
جواب الشرط أو الجملة المعطوفة. الشكل ؛ يوضح التمثيل الشجري لنتيجة تحليل 
البناء النحوي لجملة عربية. 


اكه 


الابداعية الافكار 


شكل ؛ : التمثيل الشجري للبناء النحوي لجملة عربية 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


ويلاحظ أن عملية الإعراب النحوي تتضمن تصنيف أقسام الكلام لكل كلمة 
وتزيد عليها بالذهاب إلى مستوى أعلى من التحليل يشمل تصنيف أقسام أشباه 
الجمل والتعبيرات الاسمية أو الفعلية أو أدوات الربط؛ وغيرها مع تمثيل هذا كله ب 
شكل شجري يعبر عن البنية النحوية للجملة. وتسمى هذه العملية أحيانًا بالإعراب 
العميق 2315128 1066 وذلك بغرض التفرقة بينها وبين الإعراب السطحي -51121 
8 107 الذي يكتفي بتحديد أقسام الكلمات وتحديد العبارات الاسمية 
والعبارات الفعلية دون تحديد البنية الكاملة للجملة. 


وتعتمد تقنيات الإعراب النحوي على تعريف قواعد النحو الحاكمة للغة 
وتمثيلها بشكل يفهمه الحاسوب ثم تطبيق هذه القواعد على الجمل لتحديد 
الإعراب الصحيح للجملة. وتنقسم خوارزميات الإعراب النحوي من حيث 
كيفية استخدام قواعد النحو إلى خوارزميات تستمعل طريقة الصعود -801]010 
هنا وأخرى تستعمل طريقة النزول 100-001/3. الأولى تبدأ من الكلمات ( أوراق 
الشجرة) وتبدأً بتطبيق القواعد النحوية التي تحتوي تلك الكلمات صعودًا حتى 
الوصول إلى جذر الشجرة ( الذي يمثل جملة مكتملة). أم الطريقة الثانية فتبدأً 
من القواعد النحوية التي تتضمن جذر شجرة ( أي تركيبة جملة كاملة) نزولا حتى 
الوصول إلى الأوراق ( الكلمات). 

وتحتاج خوارزميات الإعراب أن يتم تزويدها بقواعد النحو الخاصة باللغة 
حتى تتمكن من تطبيقها؛ ويتم تمثيل قواعد النحو حاسوبيًًا على شكل مجموعة من 
القوانين التي تُعرّف البُنى المسموح وجودها # الجملة. الشكل يحتوي مثال إيضاحي 
لبعض قواعد النحووطريقة تمثيلها وكيفية استخد امها لإعراب جملة عربية [60]. 


فقطء فالجملة الواحدة - إذا ما تجاهلنا معناها المقصود - فإنها قد تحتمل أكثر 


من تركيب نحوي. 
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ولذلك فإن العديد من خوارزميات الإعراب شائعة الاستخدام حاليًا تلجأ إلى 
الطريقة الإحصائية 10361مم4 5130151021 والتي تهدف إلى إعطاء قيمة احتمالية 
لكل قاعدة من قواعد التركيب النحوي بحسب مقدار تكرر استعمالها 4 سياق 
الجملة التي يراد إعرابهاء كما أنها تعطي درجة احتمالية لكل شجرة من الشجرات 
النحوية العديدة التي يمكن بناؤها للجملة الواحدة: وعادة ما تستخدم خوارزمية 
بحث مثل 11ط2180131 7711611 للبحث عن أفضل شجرة 4 فضاء الشجرات المحتملة 
(دون الحاجة لاحتساب احتمالية كل شجرة بالكامل) . ويتم تعلم القيم الاحتمالية 
للقواعد من خلال استخدام مجموعات نصية مصنفة ومعربة 5كلطة0ء1:6' كتلك 
المستخدمة 4# عملية تصنيف أقسام الكلام التي أشرنا إليها ب الفصل السابق. 


الشجرة الإعرابية ل أشرب القواعد وشرحها باللغة العربية 
11 
شايا لذيذا 


الجملة يمكن أن تكون جملة 
فعلية 
الجملة الفعلية تتكون من فعل 


وعبارة اسمية 


ما حدم 


ماح ا حدم17 


العبارة الاسمية يمكن أن تتكون 0 حا 5 


من اسم وصفة 


شكله : مثال يوضح طريقة تمثيل قواعد اللغة وتطبيقها لاعراب جملة 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


ومن أدوات الإعراب المتاحة للباحثين والمطورين 99روويوط لروكوةا؟ عطاكت 
وهي تدعم اللغة العربية إلى جانب الإنجليزية والصينية والإسبانية؛ ويمكن 
استخدام نفمس الأداة لتصنيف أقسام الكلام كذلك عطاعع 12 اءععءم01-5-تتهط: 
ومن الأدوات أيضًا للللروويروم و [ج 891 [ 87 ] والتي تدعم اللغة العربية والإنجليزية. 


نتحليل العلاقات الاعتمادية (الاعراب) ع8ماوتةط تزعمعلمعمءد1 

وهونوع آخر من التحليل البنائي للجمل ولكنه يهدف إلى تحديد العلاقات 
بين الكلمات وتبيان أي الكلمات أو التعابير تعتمد معنويًا أونحويًا على كلمات أو 
تعابير أخرى مع توضيح نوع الارتباط الذي يجمع بينهماء ومن أمثلة ذلك ارتباط 
الاسم بالفعل 4 جملة عندما يكون الاسم فاعلًا كما ف "شرب الطفل الحليب", 
الفعل ' شرب" مرتبط بعلاقة اعتمادية مع الاسم 'الطفل" حيث أن الطفل هو 
الفاعلء وبالمثل كلمة '"الحليب" مرتبطة بالفعل "شرب" لكونها المفعول به. وقد 
تكون العلاقات التي تربط مكونات الجملة علاقات معنوية 560132616 أو علاقات 


نحوية هناء018:ز5أو علاقة تصريفية 0108121م2/]01. 


ويوضح الشكل 5 مثال لجملة عربية (آية قرآنية من سورة الملك) وإعرابها 
والعلاقات الاعتمادية بين مكوناتها 0 


لمتغطد. 2151م عع 1/ع5]221010.6011/5015721.ملط//:ماغط (1) 
72151 ط0/ 6.863/0015/نالع.أتحط. داع لا /:صاخط (2) 


0 المثال مأخوذ من موقع المجموعة النصية القرآنية 
.1311 . 6010115//:ماخط 
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ا لذ ى بده 1 لحك 


اعم م لل لزهمجم 1 
مم 
85 


شكل 5: العلاقات الاعرابية والاعتمادية بين مكونات آية: تبارك الذي 


بيده المللك. 


وقد تناولت العديد من الأبحاث دراسة تحليل العلاقات الاعتمادية 4# اللغة 
العربية؛ وقد ركزت 4# معظمها تطبيق الخوارزميات المستخدمة 4# اللغات الأخرى 
على اللغة العربية مع إضافة خصائص صرفية وبنيوية إضافية تخص اللغة العربية 


حتى تساعد الخوارزميات على تحسين دقة الإعراب للجمل العربية [/41/-350]. 


ومن أدوا تالاعراب المتاحة للباحثين والمطورين ('كرودرو«وطننا [ 91 ]. 
تمييز أسماء الكيانات (الأعلام )0ع بخص - لع موادا 
كشير من تطبيقات معالجة اللغات تتطلب أن يتمكن التطبيق من تمييز أسماء 
الكيانات ومعالمتها بشكل خاص عند معالجة النصء وتشمل أسماء الكيانات ب 
الغالب أسماء الأشخاصء وأسماء الهيئات. وأسماء الأماكن كالدول والمحافظات 
والمدن: وأحيانا تضاف إليها الأزمنة وأشياء أخرى. هذه هي التصنيفات الشائعة 


11150122151 / تلك .تتحتك.5ع .17107017.21:1/ رصاخط (1) 
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الحرفالعربي والتقنية 
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+ أغلب التطبيقات؛ ولكن قد تحتاج بعض المجالات إلى تحديد أصناف أخرى من 
أشهطاء الأعلام فمثلًا ب التطبيقات الطبية تجد أصناف من مثيل أسماء الجينات 
وأسمناء البروتينات وأستفتاء الأمراض وأشمناء الأدوية. 

تعل + يشوطن ينا لا لعيلة عرس ناخو كفن خب افق والتسوة الحفة 
بعد تطبيق أحد الخوارزميات العامة لتمييز أسماء الكيانات على تلك الجملة. 


عقدت جامعة الدول العربية اجتماعًا برئاسة أحمد العربي 
لمناقشة أوضاء القدس 


عقدت [جامعة الدول العربية]... اجتماعًا برئاسة[ أحمد 
العربي].. لمناقشة أوضاع [القدس]_ 


شكل : مثال يوضح نتيجة تطبيق خوارزمية تحديد أسماء الأعلام على نص عربي. 


وتحتاج العديد من التطبيقات لهذه العملية بشكل أساسي حتى لا تخلط 
بين أسماء الكيانات التي ينبغي معاملتها كتعبير واحد كل الوقت, وبين الكلمات 
المتفرقة؛ ومن هذه التطبيقات أنظمة اشتقاق المعلومات -1:286 1010260م1 
0ن وأنظمة الإجابة الآلية للآسئلة 5/5105 41151861108 0116511011 ومحركات 
البحث 12810265 طاع5ة56 والترجمة الآلية 120512660" عصتطءعة]/1. 


وكفيرها من وظائف معالجة اللغات. فإن التقنيات المستخدمة لتمييز أسماء 
الكيانات تنقسم بشكل أساسي إلى خوارزميات تستخدم قواعد وقوانين مصاغة 
يدويًا تعرف الحاسوب على الأنماط النصية التي تظهر فيها أسماء الكيانات, 
وخوارزميات أخرى إحصائية 5]26156168[1 -وهي المستخدمة الآن- وتعتمد على 
تقنيات تعلم الآلة. ومن أشهر التقنيات المستخدمة حاليًا -هه1 6001610081 
59 003 إلا أنها تحتاج إلى توفر كميات كبيرة من النصوص التي يتم تحديد 
أسماء الكيانات فيها يدويًا لاستخدامها لتدريب الخوارزمية. ومن الطرق التي 
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أظهرت جدوى وهي أيضًا تحتاج إلى كمية كبيرة من النصوص -ولكن كمية الجهد 
اليدوي اللازم فيها أقل- تلك الطرق التراكمية التي تبدأً بمعرفة كمية قليلة من 
أسماء الكيانات: وتتعلم الأنماط التي تظهر فيها بشكل متكررء ثم تستخدم هذه 
الأنماط للتعرف على المزيد من أسماء الكيانات: ثم منها تتعرف على مزيد من 
الأنماط وهكذا. وقد لخصن البحث الاستقصائي المشار إليه 4 [171] أبرز الطرق 
المستخدمة لتحديد أسماء الكيانات وقارن بين تلك الطرق:؛ وعلى الرغم من كون 
البحث منشورًا ٠٠١7‏ إلا أن تقنيات تحديد أسماء الكيانات كانت قد وصلت 3 
ذلك الوقت إلى درجة عالية جدًا من الدقة: ولم تشهد أي تطور كبير خلال الفترة 
التالية. 


أماك اللغة العربية فقد ظهر الاهتمام بهذا الموضوع متآخرًا بعض الشيء. 
وقد رصد الاستقصاء المشار إليه :[؟4] أبرز ما يخص اللغة العربية 4 هذا 
الموضوع من تحديات: ولخص أهم الطرق المستخدمة فيه وعرض تقييمًا لكل منها. 

وتعتبر عملية تمييز أسماء الكيانات 4# اللغة العربية أصعب نسبيًا من اللغات 
الأخرى. ومن أسباب ذلك مثالا أن اللغة العربية لا يوجد # طريقة كتابتها أي 
علامة تميز أسماء الكيانات على خلاف اللفة الإنجلزية مثلّا والتي تكتب فيها 
أسماء الكيانات مَُيَدَوءَةٌ بأحرف كبيرة 1.6]1615 0201181): وهي خاصية من أهم 
الخصائصص التي تعطيها خوارزميات التعلم الآلي وزنًا كبيرًا بين الخصائقص 
اللغوية الأخرى. ومنها كذلك الثراء الصرك للغة العربية والذي يسمح بدخول 
الزواكد على أسماء الكيانات وليس على الكلمات العادية فقطء مثل دخول الباء 
على '"مكة" فتصبح ' بمكة" أودخول النا على '"القدس" وإزالة أل التعريف منها 
فتصبح ' قدسنا" ؛ وهكذا. ومن التحديات أيضًا ندرة الموارد ذات الجودة العالية 
التي تحتوي قوائم بالأسماء كما يوجد #4 اللفات الأخرى. ومنها كذلك غياب 
التشكيل عن معظم النصوص العربية وينتج عنه غموض 2# كثير من الكلمات يجعل 
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عملية الاعتماد على السياق لحل الغموض عملية مهمة وحساسة؛ وتحديات أخرى 
مشروحة بالتفصيل 3 [؟1]. 


ومن الطرق التي اقترحها الباحثون لتمييز أسماء الكيانات 4 اللغة العربية ما 
طرح خ[30-44] وهي تعتمد على مجموعة من القواعد المصاغة يدويّاء وما هو 
مطروح 4 [48-57] وهي طرق تعتمد على تقنيات تعلم الآلة. 


0 


وظائف اخرى 

بالإضافة إلى الوظائف التي استعرضناها # هذا الفصل هناك وظائف أخرى 
يتكرر الاحتياج إليها 4 معالجة اللغات: ونذكرها هنا أسماءها مع ترك إشارات 
لبعضي المراجع المفيدة فيها. ومنها تحديد الإشارات المتعددة للشيء الواحد -0© 
0 112 (ارجع للاستقصاء [4و]) .وتحليل الخطاب 10150011156 
15 رارجع لكتاب ٠ )]٠٠١[‏ وتمييز وتقسيم موضوعات النص -عع 1 1م10 
مع 5 عل دماتدوه [ ١-1١1‏ 1]ء وحل التبامس معاني الكلمات 177/010 
ه565 (ارجع للاستقصاء :)]٠١”[‏ وغيرها. وهذه الوظائف 
المشار إليها هنا لم تئل حظا من الاهتمام البحثي فيما يتعلق باللغة العربية وهي بلا 
شك مجالات هامة ولازمة للغة العربية وتحتاج إلى من يبادر ويتصدر للبحث فيها. 
". أشهر تطبيقات معالجة اللغات 

وأخيراء تتشرطى ها اشير كطوفات نعالجة اللعاك الى نهدت تقاطا 
بحثياك اللفة العربية. وتستخدم هذه التطبيقات # أغلب خطوات تنفيذها 
الوظائف التي استعرضناها ش الباب السابق. 


الترجمة الآلية 12000دمة]' عستطعة]/! 
كما ذكرنا 4 بداية هذا البحثء فقّد كانت الترجمة الآلية من أوائل تطبيقات 
معالجة اللغات التى لاقت اهتمامًا كبيرًا 4 الستينات وأوائل السعبينات من القرن 
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الماضيء ثم خفت الاهتمام بها بسبب النتائج المخيبة للآمال 4# ذلك الوقت؛ ثم 
عادت الأبحاث 4# هذا الموضوع لتنتعش 2# التسعينات من القرن الماضي وحتى يومنا 
هذا من قرننا الحالي. ويعتبر مجال الترجمة الآلية من المجالات البحثية الساخنة 
جدًا كك الوقت الحالي؛ وقد حققت نجاحات وقفزات كبيرة وملموسة؛ ولم تعد تلك 
التقنيات مقصورة على البحث العلمي بل أصبحت من المنتجات المهمة 2# الصناعة, 
وتوجد 2 الأسواق خدمات ترجمة آلية تقوم على تطويرها والترويج لها شركات 


كبيرة مثل 11732513101 8108 من مايكروسوفت وع]11825192 عاع0008 وغيرها. 


ويعود الفضل يْ تحقيق القفزة الكبيرة 4 مجال الترجمة الآلية إلى بروز 
وانتشار الطرق الإحصائية 71615005 5186501621 : فبعد أن كانت عملية الترجمة 
تتطلب فهمًا عميقًا لقواعد ومعاني وتراكيب اللغة المصدر واللغة الهدف وصياغة 
قواعد وقوانين معقدة لترجمة النص.ء فإن الطرق الإحصائية أتاحت ترك استنباط 
هذه القوانين والقواعد لخوارزميات التعلم الآلي؛ التي تستنبط هذه القوانين من 
خلال معالجة عدد كبير من المجموعات النصية المتوازية 01:8م001) 221231161 بعد 
إجراء عملية ربط لكل جملة 4 المستند المكتوب باللغة المصدر إلى الجملة المقابلة 
لهاك اللغة الهدفء وفعل ذلك الربط أيضًا على مستوى الكلمات. وقد سهل انتشار 
الانترنت وتقنيات النشر الالكتروني كثيرًا من إمكانية توفير مثل هذه المجموعات 
النصية؛ ومن أشهر المصادر لهذه المجموعات وثاكق الأمم المتحدة التي تتم 
ترجمتها أولا بأول إلى كل لغات العالم الأساسية, وكذلك ترجمات الكتب, وكذلك 
المواقع الالكترونية التي تحتوي صفحات متعددة اللفات: وغيرها. 

وكحال غيرها من تطبيقات معالجة اللغات فإن الفترة الأخيرة شهدت ميلا 
للجمع بين الطرق المعتمدة على القواعد المصاغة يدويّاء والطرق المعتمدة على تعلم 
الآلة. بحيث تصاغ بعض القواعد الضابطة التي تقيد وتحكم استخدام نتائج التعلم 
الآلي بهدف منع الوقوع 2 أخطاء يسهل ضبطها بالقوانين اللغوية. 
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وقد شهدت الترجمة الآلية من والى اللغة العربية اهتمامًا متزايدًا مؤخرًا 
ومن أمثلة ذلك: ترجمة عربي-إنجليزي ٠١5-٠١41‏ ] وعربي-فرنسي [7١٠]ء‏ 


.]١ :1[ وعربي-صيني‎ 


التلخيص اللي 51112112112200 1010ل 

تهدف عمليات التلخيص الآلي إلى اختصار الكلام؛ وتقليل كمية النص إلى 
مقدار محدد يختاره المستخدم أو يفرضه التطبيق مع الحفاظ على أهم المعاني 
والمفاهيم الواردة ب النصص. ويفرق البحاثون بين نوعين من التلخيص الآلي: أُولًا: 
الااختصار الاقتباسي 511111112112211052 181301176 وفيه تكون جمل المللخص 
مقتطعة كما هي من نص المصدرء أي إن عملية التلخيصص #4 هذه الحالة ما هي 
إلا عملية ترتيب للجمل حسب أهميتها ومقدار ما تحتويه من معلومات هامة وتغطي 
جوانب الموضوع. ثانيًا: الاختصار الخلاصي 51111111211281100 1576أ405]13 وفيه 
قد تكون جمل الملخص مولدة آلا أوناتجة عن إحداث تغييرات وعمليات حذف 
أوإضافة أو تعديل على الجمل القادمة من النص المصدرء وهي أصعب بمراحل 
من التلخيصى الاقتطاعي الاقتطاعي لأنها تتضمن عملية توليد الجمل؛ وتحتاج 
إلى توفير سبل ضمان رصانتها وتماسكها وسلامتها النحوية وصحة معانيها وعدم 
تناقضها مع المعلومات الواردة 4 المصدر. 

والتلخيص الآلي -لاسيما التلخيص الاقتطاعي- واحد من الموضوعات التي 
شهدت قدرًا من الاهتمام 2# اللغة العربية؛ وجاءت أغلب الأبحاث 2# الموضوع لتطبق 
الطرق المستخدمة # اللغات الأخرى مع إضافة بعض عمليات المعالجة التي تخص 
اللغة العربية؛ ومن أمثلة الأبحاث التي تناولت التلخيص العربي ١١7-١١91‏ ]. 
تصئيف النصوص 013551502161005 ]162 

تقوم أنظمة تصنيف النصوصى بتحليل النص و تصنيفه بحسب موضوعه أو 
محتواه الى أصناف محددة تختلف من تطبيق لآخرء ومن أمثلة ذلك تصنيف الأخبار 
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بحسب موضوعها إلى أخبار سياسية: أورياضية: أو علمية؛ إلخ. وتعتمد أغلب هذه 
الأنظمة اليوم على تقنيات تعلم الآلة الملخصصة لعمليات التصنيف -13551668© 
0» وتستخدم 2 ذلك مجموعة من الخصائص من أشهرها مجموعات الكلمات 
595 - المفردة والمزدوجة والثلاثية (وغاليًا يتم ذلك بعد تجذيع الكلمات -51]610 
). وخصائص أخرى تختلف بحسب التطبيق. 


وتصنيف النصوص العربية هو أيضًا أحد الموضوعات التي لاقت اهتمامًا من 
قبل عدد من الباحثين [؟١0-1١1١1].‏ 


نحليل المشاعر واستكشاف الآراء 0217:515ك الاعسطتامء5 

وهي عملية يتم فيها تحليل المحتوى النصي بهدف الكشف عما يحمله من 
مشاعر سلبية أو إيجابية أومحايدة: وتستخدم هذه العمليات بشكل كبير ب تحليل 
المراجعات التي يكتبها الناس على الإنترنت تعليقًا على ما يشترونه من منتجات. 
أو تلك التي يعلق بها الناس على ما يشاهدونه من أفلام مصورة أو مقاطع صوتية: 
وكذلك 4 قياس الرأي العام تجاه القضايا العامة والقضايا السياسية؛ وتفيد هذه 
العمليات صناع القرار يي الشركات أو الدوائر الرسمية لاتخاذ ما يلزم من قرارات 
وسياسات. وقد ازداد الاهتمام بهذا الموضوع بشكل كبير مع انتشار الانترنت, 
ومع ثورة شبكات التواصل الاجتماعي تحديداءً حيث أصبحت هذه الشبكات مليئة 
بالنصى ال محمل بالمشاعر والآراء التي يمكن لصناع القرار الوصول إليها وتحليلها 
والخروج باستنتاجات من خلالها. 

وتعتمد هذه الأنظمة على تحديد الكلمات والتعبيرات السلبية والإيجابية ‏ 
اللفة مشلا كلمة "سعين" هي كلمة إيجابية وي المقابل كلمة "حزين" هي كلمة 
سلبية. وقد تعتمد قطبية الكلمات على الموضوع فمثلًا عندما يوصف سيناريوفيلم 
ما بأنه "غير متوقع" فهذا قد يكون مؤشر إيجابي يدل على أنه مشوق. ‏ المقابل 
عندما يوصف مقود التحكم # السيارة بأن "غير متوقع'" فهذا تعبير سلبي يدل 
على أنه خطير ويصعب التحكم فيه بدقة عند القيادة. 
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وقد ظهر اهتمام كبير مؤخرًا بتطبيقات تحليل المشاعر واستكشاف الآراء ب 
اللغة العربية وظهرت العديد من البحوث التي اقترحت آليات لبناء قوائم بالتعابير 
الإيجابية والسلبية المستخدمة # اللغة العربية ,]١١7-١١7[‏ وأخرى تناولت تحليل 
نصوصص شبكات التواصل الاجتماعي كمنتديات الحوار ومواقع التدوين القصير 
لقياس الرأي العام .]1١١-١14[‏ 
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خاتمة 


عرّفناك# هذا البحث الاستقصائي بتقنيات معالجة اللغات الطبيعية, 
واستعرضنا أهم الوظائف الأساسية التي يلزم إجراؤها على النصوص 2# أغلب 
تطبيقات معالجة اللغات؛ وأوضحنا ما للغة العربية من خصوصيات # كل من تلك 
الوظائف مع ترك إشارات مرجعية للبحوث التي تناولت كل وظيفة حتى يعود إليها 
القارئ المهتم بمعرفة التفاصيل. كما أشرنا إلى العديد من الوظائف الأخرى التي 
لم يتطرق إليها البحث 4# اللغة العربية فيما نعلم وتحتاج إلى مبادرة الباحثين 
لطرق بابها. ثم عرضنا نماذج لتطبيقات مهمة لتقنيات معالجة اللغات لاسيما 
تلك التي اهتم بها الباحثون 2 اللغة العربية. وتركنا كذلك إشارات مرجعية لتلك 
الأبحاث التي يمكن أن يرجع إليها القارئ المهتم بالتفاصيل. 
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الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


استخدام القواعد الاستنباطية 4 تحسين أداء التشكيل الآلي 


أ عمر السيد شعبان “ 


211.602 قتاع 01121.5.5122121:)6 


)2 باحث ف مجال الحوسبة العربية: درس الهندسة البرمجية ي جامعة الملك فهد للبترول والمعادن 
وحصل منها على درجة ا لبكلوريوس عام .7٠04‏ حصل على الماجستير من نفس ا لجامعة عام 7١11‏ 
تخصص علوم الحاسب الآلي؛ وكانت رسالة الماجستير عن التشكيل الآلي 4# اللغة العربية. من 
اهتماماته الأخرى التعرف الآلي على الكلام؛ والتصحيح الآلي للنصوص. 


م8١‎ 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


ملخص"»") 


يعتبر التشكيل الآلي 2# اللغة العربية أحد أهم المباحث # مجال الحوسبة 
العربية. حيث يُمثل مرتكرًا رئيسًا لمباحث أخرى + نفس المجال كالتعرف الآلي 
عنس الكاقم الغربي والتمان الأنى: ونه مريحنة تمليل كام "اللفة المصندر ترح 
الآلية. كما يُمكن الاستفادة منه من قبل دارسي اللغة العربية حيث يُعتبر غموض 
من الكرية غير لقكدة كدو كيرا توم ويخامنه الطدتين تيه 


قام الباحثون باتباع طرق عديدة # التشكيل الآلي أغلبها وأنجحها يعتمد على 
الكرد الجر ئية والتعلم الآلي. كما قام بعضهم بمحاولة اتباع الطرق النحوية 
التي تعتمد على قواعد اللغة العربية وإن كان نجاحهم 4# ذلك مقصورًا على الجمل 
القصيرة البسيطة. وربما كان السبب الرئيس 2# ذلك هو الغنى اللغوي الذي تتميز 
به اللغة العربية عن بقية اللغات. 


اع ع اعم م مح لمكي 00 
القواعد بذ مرحلتين: مربحلة التنظيف وهي المرحلة التى يتم فيا استبطا التشكيل 
ع روي ارت كيو لزع عه 

ا اه ا ا د 
ب المتوسنظلء وكذلف تحشث ان نسية الخطأ الكلمي بمعوسط 1/7و نسبة 
الخطأ الحرك بمتوسط .7٠١‏ 

10 يعتمد هذا البحث على رسالة بعنوان ' استرجاع التشكيل آليّا للنصوص العربية'' 


قدمت لجامعة الملك فهد للبترول والمعادن ومئح بموجبها الباحث درجة الماجستير 


1١317 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


مقدمهة 

تعد معالجة اللغة الطبيعية (2:آ71 2100655118 811386 31.آ 713111131) أحد 
المواضيع المهمة 4 علوم الحاسوب واللسانيات الحاسوبية. وقد تطورت كثيرا على 
مدار العقود الثلاثة الماضية. وتكمن أهمية معالجة اللغة العربية 4 انتشار الإنترنت 
والأجهزة المحمولة التي تتطلب المزيد من التفاعل الطبيعي مع المستخدمين. فبعض 
تطبيقات معالجة اللغة الطبيعية مخصصة لأهد اف لغوية مستقلة كالمدقق والمصحح 
الإملائي والنحوي وبعضها تستخدم كأدوات مساعدة لتحقيق أغراض أكثر تعقيدًا 
كالتعهرف الآلي على الكلام (4516 0ه تمع معع] باوععءم5 1101011اكى ) حيث 
يستطيع الشخص إطلاق أوامر صوتية أو إملاء نص للحاسوب. وكذلك مثل تحويل 
النصص إلى كلام (1"15 داهدءهم10-10-5) حيث يقوم الحاسوب بنطق نص ما أو 
إعلام المستخدم بأمر ما. 


التشكيل 2 الكتابة العربية 

تتكون الأبجدية العربية من 78 حرمًاء منها 0" حرف صامت؛ و" أحرف علة 
(صائتة) (الآلفء والواوء والياء (» ويمكن للواو والياء أن يكونا ساكنين (شبه 
صائتة) كذلك .]١[‏ 


يمكن لكل حرف صامت أن يُشكل بإحدى ١4‏ طريقة كما يبينها الجدول ١‏ 
ويمكن تصنيف هذه الطرق ْ خمس مجموعات: الأولى تمثل الحركات البسيطة 
وهي الفتحة والضمة والكسرة, والثانية تمثل حركتي التقطيع وهما السكون والشدة, 
والثالشة تمثل التنوين ( تنوين فتحء تنوين ضمء تنوين كسر), أما المجموعتين 
الرابعة والخامسة فتمثلان الحركات المركبة من الشدة مع حركة من 
الحركات البسيطة. 


ه18 


يمكن أن نقسم عملية تشكيل الكلمة # اللفغة العربية إلى قسمين: تشكيل 
صرك؛ وتشكيل إعرابي. ونعني بالتشكيل الصر؛ التشكيل الداخلي للكلمة الذي لا 
يتغير بتغير موقع الكلمة # الجملة. أما التشكيل الإعرابي فيكون عادة ‏ الحرف 
الأخير من الكلمة ويمكن أن يتغير بتغير موقع الكلمة # الجملة. ويمكن اعتبار 
القتسم الأول العامل الأساس # تحديد معنى الكلمة؛ أما القسم الثاني فهو العامل 
الأساس # تحديد معنى الجملة ككل. ويمكن عند التشكيل الآلي؛ استخدام الطرق 
الإحصائية لاستنتاج القسم الأول أما القسم الثاني فلا يمكن استنتاجه إلا 
باستخدام القواعد النحوية. 

جدول ١‏ تقسيم التشكيل العربي 
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تعريف المسألة 

نهدف 2# هذا البحث إلى تطبيق التشكيل الآلي على النصوص العربية؛ وبمعنى 
أدق؛ يمكن وصف مسآلة التشكيل الآلي بأنها عملية استرجاع التشكيل الناقص من 
النصوصص غير المشكلة ( أو المشكلة جزئيًا) . يبين مثالا على نص غير مشكل (1): 
والتشكيل المفترض بعد تطبيق التشكيل الآلي (ب) . 


2 ف ا 2 
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(أ) المدخل (ب) المخرج 
رسم توضيحي ١‏ : مثال على مخرجات عملية التشكيل الآلي 


التشكيل الآلي هو أحد قضايا معالجة اللغة الطبيعية التي يمكن اعتبارها 
مستقلة لها تطبيقاتها الخاصة:؛ كما يمكن اعتبارها أداة مساعدة لتطبيقات أكثر 
تعقيدًا. وتظهر هذه المسألة 4 اللفات السامية بشكل خاصى كالعربية والعبرية, 
وكذلك ْ بعض اللغات الأخرى مثل اليونانية والكورية [7]. وباعتبار اللغة العربية 
يُحذف التشكيل عادة تاركًا مهمة تحديد معنى الجملة لفطنة القارئ؛ وهذه ليست 
مشكلة للقارئّ الخبير الذي يستطيع بخبرته تحديد المعنى المقصود بناء على 
السياقء ولكن تبرز مشكلة تقدير التشكيل للقارئ المبتدئّ - وكذلك للحاسوب - 
حيث لا يمكن تحديد معنى الجملة بسهولة. ومن هذا المنطلق تظهر الحاجة إلى 
التشكيل الآلي. 


تطبيقات التشكيل الآلي 

يمكن استخدام التشكيل الآلي بصورة مستقلة أو بصورة مساعدة لمسائل 
أخرىء فعند تطبيقه يمكن أن يقلل من غموض النص ويساعد # تحديد المعنى 
المقصودء وهذا مفيد بحد ذاته. كذلك فإن تشكيل النص هو أمر أساس # مسألتي 
التعرف الآني على الكلام وتحويل النص إلى كلام والترجمة الآلية. إذ تُستخدم 


١مل‎ 


الطرق الإحصائية 4# التعرف على الكلام على الأغلب والتي تعتمد على وجود مكنز 
كفك لاسن عدون عت هذا العدروظإراحيوة البانكانن ميرت يذ بزاته 
بصورة يدوية؛ وهذا أمر شاق للغاية. أما عند تحويل النص إلى كلام فيتطلب أن 
يكون النص المراد نطقه مشكلا تشكيلا كاملا. ولذاء فإن بناء نظام للتشكيل الآلي 
إضافة ضرورية لتطبيقات وبحوث الصوتيات العربية. 


أساليب التشكيل الآلي 

لقد ازدادت الأبحاث المنشورة المتعلقة بالتشكيل الآلي؛ سواء للعربية أو 
غيرهاء 4 العقد الأخير» وي هذا الفصل نعرض آخر الأبحاث 4# هذا الموضوع. إذ 
نعرض الأبحاث المتعلقة باللغة العربية 4 القسم ١,؟:‏ بينما نعرض بعض الأبحاث 
المتعلقة باللغات الأخرى 2# القسم ؟, 1؟. أما القسم ؟,؟ فيعرض مقارنة بين الطرق 
المستخدمة # الأبحاث التي اطلعنا عليها. 


التشكيل الآلي 2 اللغة العربية 
الوضعين المزدوجين. حيث يقوم الوضع الأول بالبحث # قاموس يحتوي على كلمات 
كاملة ومشكلة؛ باستخدام البحث الشعري 4*, وتقدير الاحتمال التسلسلي طويل 
المدى لأجل الحصول على أقرب تشكيل ممكن. وي حال لم تكن الكلمة ( أو سلسلة 
الكلمات) موجودة 4# القامومن ( 0077 '0101-01-1/003111313)؛ يقوم الوضع 
الثاني بتحليل كل كلمة إلى جميع احتمالاتها الصرفية ثم يعيد البحث 2 القاموس 
لكل احتمال. يقول المؤلفون بأن النظام حقق نسبة خطأ ١‏ , 7" على مستوى الكلمات: 


و2760 على مستوى الأحرف. 


واتبع الزيتوني وساريكايا [؟ا طريقة الإنتروييا القصوى (-10 712الطل:2/13 
'(08) لاستنتاج التشكيل. و؛4 هذه الطريقة يمكن استخدام معلومات متعددة 
بصورة تكاملية كالخصائص الكلمية؛ والقطعية؛ ووسوم أجزاء الكلام. وعلى هذا؛ 
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قام المؤلفان بتعريف مسألة التشكيل الآلي على أنها مسألة تصنيف. واستخدما 
مصَنّف غمطاعه]1, كما استخدما # تجاريبهما المكنز علطواءع11 عاطوتكى )1ل 
وبناء عليه تم التوصل إلى درجة خطأ كالتالي: “١1,7‏ على مستوى الكلمة باعتبار 
التشكيل الإعرابي و7 7/ بتجاهله؛ درجة خطأ ١‏ , 0 على مستوى الأحرف باعتبار 
التشكيل الإعرابي و؟, 7 بتجاهله. 


واستخدم الشافعي وآخرون [ ؛ ] نماذج ماركوف المخفية (1/1371017 111006 
2100615 ) لحل مسألة التشكيل الآلي. تطلب هذا الأسلوب مكنزًا كبيرًا 
من النصوص المشكلة لأجل استخراج الخصائص التي ستستخدم 2# النمذجة: 
وقد قام بعض المؤلفين باستخدام نصوص القرآن الكريم للنمذجة والاختبار. كما 
استعمل المؤلفون سلسلة الكلمات غير المشكلة كخصيصة:؛ واعتبروا أن الحالة 
انيدهي البطسلةذانها تشكلة برها ع ولاك فرصيو ان مه خط 111 
انخفضت بعد ذلك إلى 7,0“ باستخدام مرحلة ما قبل المعالجة وسلاسل ثلاثية 
مختارة. 


وقد وصف عطي ة[6] نظام هذ طسمة: وهومش كل تجاري يُستخدم بذ 
النسخ النطقي للكلام؛ وقد استعمل أسلويًا يدمج بين القواعد والإحصاءات لأجل 
استخراج التشكيل الأقرب لنص ما. ويعمل هذا النظام ‏ أربع مراحل: تماد 
الكلمات المختصرة والأرقام # المرحلة الأولى إلى ألفاظها.ء وي المرحلة الثانية 
يقوم المحلل المفرداتي بتحديد التشكيل الأنسب للكلمة وكذلك الأجزاء الصرفية 
لها أوتحديد ما إذا كانت الكلمة معرّبة أم لا. و المرحلة الثالثة يقوم الواسم 
بتحديد وسوم أجزاء الكلام لكل كلمة غير معرّبة ومن ثم يقوم المحلل الإعرابي 
بتحديد التشكيل الإعرابي؛ أما ئ حالة كون الكلمة معرّبة فتستخدم الإحصاءات 
والقؤاضت الحتوييه اوسن أفضن تمكيل لها وأحير ١‏ تحزن التصيوسن اتشكلة إلى 
النسخ النطقي # المرحلة الرابعة باستخدام قواعد خاصة آخذة 4 الاعتبار تأثير 
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نطق الكلمة على الكلمة التالية لها. حصل المؤلف على دقة 251 ( لو تضع هنا نسبة 
الخطأ أيضا لتسهل المقارنة) دون اعتبار أواخر الكلمات: و8/8// (لو تضع هنا نسبة 
الخطأ أيضا لتسهل المقارنة) باعتيارها. 


التشكيل الآلي 2 اللغات الأخرى 

بالرغم من أن أكثر الأبحاث المتعلقة بالتشكيل الآلي خاصة باللغة العربية؛ إلا 
إن عددًا من الباحثين قد درسوا هذه المسألة على لغات أخرى كالسندية والأردية, 
والتي تشبه العربية # الكتابة: مما يجعلها مرتبطة بموضوع البحث بشكل كبير. 

فقد قام جافيد وآخرون [1 ] بدراسة مسألة التشكيل الآلي للغة السندية 
وهي لغة يُتحدث بها ب باكستان وأجزاء من الهند؛ فقاموا ببناء نظام يستخدم 
ال 78042164 والتي تخزن العلاقات الدلالية بين الكلمات: واستخدموا فيه ثلاثة 
مكانز: الأول سَمَّوهِ 01111041 ويستخدم للكلمات الغامضة والهامة؛ والثاني وقد 
سَمَوه 110110177971117 يتستخدم للكلمات الهامة المتشابهة 2# الكتابة المختلفة ب 
المعنىء أما الثالث ,11/211 فيستخدم للكلمات القياسية. وبحسب تجاربهم؛ حصل 
المؤلفون على نسبة خطأ١, 2*٠‏ على مستوى الكلمات: و9؟, 7/ على مستوى 
الأحرف. 

وك مازيئل وآخرون []] على اللقات السامية ويشكلخاضن اللغةالسيريافة: 
إذ استخدموا طريقة نماذج ماركوف المشروطة (-1100 21/131107 00201610581 
واه ) كذ التشكيل الآلي والتي تتطلب مكنزًا مشكلاء واعتمدت الكلمات ( أو 
الأجزاء) المشكلة السابقة على الكلمة # بناء تلك النماذج. وقد حقق المؤلفون نسبة 
خطأ ١١‏ على مستوى الكلمة للعربية؛ وه, ٠١‏ للسيريانية. 

كما قام علي [4] بدارسة المسألة للفة الأردية؛ فبين كيف قام ببناء نظام 
للتشكيل الآلي قد اعتمد على مُعجم ومكنز مشكل وموسوم يدويًا. ويمكن تلخيص 
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طريقة عمله كما يلي: أولا؛ تال علامات التشكيل من النص قبل معالجته. ومن ثم 
يقوم الواسم المعتمد على 1181/1 بوسم الكلمات؛ ثم يتم البحث عن الكلمة ووسمها 
3 القجم كيت احضو على الكلنة مشكة رون اال تكترهن الكزنة ين علي 
الكلمة باستخدام القواعد وإلا فتُستخدم الإحصاءات لتشكيلها. وقد وصلت دقة 
هذا النظام إلى 54 (لوتضع هنا نسبة الخطأ أيضا لتسهل المقارنة) بحسب ما 
ذكر المؤلف. 
قواعد التشكيل الاستنباطية 

يتميز التشكيل 4 اللغة العربية بدرجة كبيرة من التعقيدء إلا إن المتأمل يمكنه 
أن يلأ حظ الكتير من القواعد والأنماط المتكررة التى تتم يظ التشكيل إلن خد كبيق 
ومن ذلك - على سبيل المثال - أن حرف التاء المربوطة »الذي يكون دائمًا ف نهاية 
الكلمة؛ لا بد أن تسبقه حركة الفتح كما 'حَمَّرَة' و رَغْبّة", وقس على هذا كثير 
من القواعد التي يمكن استنباطها عن طريق الاستقراء. 

الخصائص 

للتعرف على قواعد التشكيل الاستنباطية لا بد من تحديد الخصائص التي 
تتكون منها هذه القواعد» فقاعدة التاء المربوطة السابقة لا تتطلب سوى معرفة أن 
الحرف التالي هو تاء مربوطة. ولكن يمكن للقاعدة أن تحتوي على خصائص أكثر 
من ذلك بكثير. لهذا قمنا بتحديد ١7‏ خاصية متعلقة بالحرف الحالي وما قبله وما 
بعده.؛ والكلمة الحالية وما قبلها وما بعدهاء وخصائصص أخرى كطول الكلمة وهي 
كالتالى: 


.١‏ الحرف الحالي: ويمكن أن يحتوي كل الأحرف العربية بجميع أشكالها 
وهي 71 شكلا؛ وهي الأحرف الثمان والعشرون مضامًا إليها الهمزات 
بأشكالها الست» والآألف المقصورة. والتاء المريوطة. 


لحل 


موقع الحرف الحالي: ويحسب الموقع من بداية الكلمة ويأخذ قيمًا من ١‏ 
إلى طول الكلمة؛ دون أخن حركات التشكيل والكشيدة (حرف التطويل) 


الحرفان السابقان للحرف الحاليء والحرفان التاليان له: حيث يمكنهم 
-جميعا- أن يكون أحد الأشكال المذكورة 4 النقطة »١‏ بالإضافة إلى 
القيمة الفارغة 71 إذا كان الحرف غير متوفر. 

حركات التشكيل للحرفين السابقين والتاليين (إن توفرت) : وتأخن أحد 
١+‏ قيمة ممكنة أو القيمة الفارغة 1[ إن لم تتوفر. 

الكلمة الحالية: ويمكن أن تأخذ أحد ٠٠٠١‏ قيمة هي الكلمات الأكثر 
استخدامّاء وإن لم تكن ضمن تلك الكلمات فتأخن القيمة الفارغة 71. 
الكلمتان السابقتان والكلمتان التاليتان: وهي كالكلمة الحالية 4 عدد 
القيم الممكنة. 


طول الكلمة الحالية (دون أخذ الحركات ولا الكشائد # الاعتيار) . 


استخراج القواعد 

بعد تحديد الخصائصى التي ستؤخذ 2# الاعتبار عند استقراء القواعد آليا 
نقوم باستخراجها عن طريق برنامج خاص كنيناة لقراءة نصوص المكنز المشكل 
سابقًا وتسجيل القواعد الممكنة دون استبعاد أي منهاء ثم تخزينها ب ملفات نصية 
تحتوي تلك القواعد وعدد مرات تكرارهاء ونسبة نجاحها. يوضح جدول ١‏ بعضًا 


من هذه القواعد. 


التطبيق 
قمنا باستخدام هذه القواعد الاستنباطية لأجل تحسين نتائج التشكيل الآلي 
وذلك بتطبيقها على مرحلتين: 


للهلا 
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.١‏ مرحلة التنظيف: وهي مرحلة استبعاد الحركات التي يستحيل أو يندر 
حصولها. ويمكن تحديد القيمة الآدنى التي يمكن عن طريقها اعتبار 
الحركة نادرة أم من نسبة النجاح أومن عدد مرات التكرار. وتكمن 
أهمية هذه المرحلة 4# أن كثيرًا من أدوات التشكيل الآلي تقوم بالتشكيل 
بطريقة إحصائية لا تراعي احتمالية وجود حركة ما على حرف ما. وقد 
لوحظ وجود الكثير من الحالات التي لا يمكن حصولها. 


؟. مرحلة التشكيل: وهي مرحلة تطبيق القواعد على الأحرف التي ليس 
لها تشكيل. سواء كان ذلك بسبب استبعادها # المرحلة الأولى أو بسبب 
نقص نسبة التشكيل 4 النص. ويمكن أيضًا تحديد القيمة الأدنى لنسبة 
التشكيل وعدد مرات التكرار التي يجب توافرها قبل تطبيق قاعدة ما. 


جدول ١‏ أمثلة على قواعد التشكيل الاستنباطية باعتبار ؛ خصائص هي الحرف 
الحالي وموقعه؛ والحرفان السابق واللاحق (مرتبة بنسبة النجاح تنازليًا). 


01 
الحالي 0 السابق | التالي | الحالي | النجاح | التكرار 
ها 
ا ا 1 
هه 1 

1ك لمكن الك 

501 لكا الك لمانا لحك 
1 كنا لقن تاس 
الا الاك الترنة اسيك 
0 لكا الككنة نانك 
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الحالي | الحالي | السابق | التالي | الحالي | النجاح | التكرار 
تقاك اا لكك اك للق 
ل ل قر ام ا كن 


الل اك كن اك الاك اكاك 1 1 


ويجدر ملاحظة أننا ‏ مرحلة التنظيف قد استبعدنا الخصائص اللمتعلقة 
بحركات التشكيلء وذلك بسب أن النص المراد تنظيفه قد لا يكون مُشْكلًا كَلنًا 
( على عكسى ال مكنز الذي تم استخراج القواعد منه) . مما قد يؤدي إلى استبعاد 
الكثير من الحركات الممكنة بطريقة خاطئة. 
طريقة التقييم 

لتقييم أداء البرنامج قمنا بيناء نص اختباري تم تشكيله يدويّاء ثم استخدمنا 
أدوات للتشكيل الآلي لتشكيل النص غير المشكل آليّاء وهذه الأدوات الست هي 
كالتالى: 


١‏ عربي 1امه.ملصتطة77/.2//:ماغخط 
*. حركات ع2.أهكلة21ط//:ماخط 


'". مدى 1/8348ع10[6م/112طنام/حطامء.:ه0طا خط 11 //:وماخط 


حل 
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غ. مشكال 21كلط215/حطامء.2لقطة)//:ماخط 
4. 16101 <م35.ع5/019ع1ع010تتطاعع /ططامء.عع-7777.101//:ماخط 


5. صخر 1.60252.68تك[312012.50//:ماخط 


ونظرًا لمحدودية توافر بعض هذه الأدوات فقد قمنا بالتواصل مع أصحابهاء 
الذين وافقوا مشكورين على تشكيل النص الاختباري باستخدام أدواتهم» وإرسال 
النصن دكن لان ٠‏ ويوضح الشكل التالي أداء كل أداة على النص الاختباري. 
ويمكنبك تلاحيظة أن مشكل مغر حمق الآداة الأفضل مفارحة بأعاريهححيت يلدت 
نسبة التشكيل فيه 57“ ونسبة الخطأ الكلمي /١١‏ ونسبة الخطأ الحرب ”/. 


النتائج المبدئية 
ين 
0 
ْ/ 
7 
5 
23 
57 
0 
ع 
عربي حركات مدى مشكال آللخ8] صخر 
مسف م لليف 1م لسن إنسبة التشكيل 8 
الك 0 كلك | هروس | بلرممىر 41 0الخطأالكلسي 88 
67 0ه 0 عم ع0 حل الخطأ الحرقٍ 18 


رسم توضيحي :١‏ نتائج تشكيل النص الاختباري باستخدام الأدوات الست 
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النص الاختباري 

يتكون النصص الاختباري من حوالي 5٠١‏ جملة (أومقطع). تم اختيارها 
عشوائيًا من المكنزء والذي روعي فيه التنوع ليشمل نصوصًا إخبارية ودينية وثقافية 
واقتصادية ورياضية. وقد تم استبعاد هذا النص من المكنز عند استخراج القواعد 
الاستنباطية. ويوضح الجدول التالي بعض الإحصائيات عن هذا النص. 


جدول ”" إحصائيات عن النص الاختباري 


عد الأحرف المرية 
عدد الكلمات المرية 
عد الكلمات الفريدة امرية 


سباسعن ا | 5 | 


المقاييس المستخدمة 

درج الباحثون # مجال التشكيل الآلي على استخدام مقياسين رئيسين 
لتحديد دقة التشكيل وهما نسبة الخطأ الكلمي (' 11/81" 6غ م8 110:0ا) 
ونسبة الخطأ الحرك (18146 182101 :0 / علفخا تمتظ رعاعه مقط ) ؛ ويتم 
قياسهما عن طريق المعادتين التاليتين: 
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ويوضح المثال 4 الجدول التالي كيفية حساب المقياسين 4# سياق التشكيل 
الآلي: 
جدول ؛ مثال لتوضيح طريقة حساب نسبة الخطأ الكلمي ونسبة الخطأ الحرخخ 
النص المشكل آلا تهد د 
التشكيل الصحيح للنص 


نسبة الخطأ الحرك 2 /2 - 0.17 1790 


ورغم أن هذين المقياسين هما الأشهر والآكثر استخداما إلا إنهما لا يكفيان 
لمعرفة درجة أداء البرنامج الذي يقوم بالتشكيل؛ فمن الممكن مثلًا أن يقوم البرنامج 
بتشكيل نص بنسبة 05٠‏ دون أن تزيد نسبة الخطأ # التشكيل عن .“١‏ لذا رأينا أنه 
من الضروري استخدام مقياس جديد ( بالتكامل مع المقياسين السابقين) هو نسبة 
التشكيل (-101) 1.6761 1(126111231102) ) : والتي يمكن حسابها بالمعادلة التالية: 


حيث يد خل ف المشكلة الأحرف الأحرف التي لا تشكل عادة إما بسبب وضوحها 
كالر ةد ميوة ]لجان اولس ل نطوو نطف كانف ؤاوالخدا ع ويدزف الوارد 
جَاوُوا. 

وتجدر الإشارة إلى أن هذا المقياس يَصعّب حسابه آليا بدقة. حيث إن الأحرف 
المشكلّة ضمنيًا لايمكن التعرف عليها بسهولة, لذلك فقد قمنا باستخدام قواعد 
مَبسطة لتحديد تلك الأحرفء. وقد حققت نتائج مقبولة إلى حد كبير. 


١وا/‎ 


النتائج والتحليل 

لاختبار أثر القواعد الاستنباطية # تحسين نتائج التشكيل الآلي باستخدام 
0 بس تن لاس 
الآأدوات الست سابقة الذكر؛ قمنا بإجراء تجربتين على النصوص المشكلة اليا: 
الأولى باستخدام حد أدنى للندرة ١‏ والثانية باستخدام حد أدنى ./٠‏ ويُمثل هذا 
الحد الأدنى الدرجة التي يتم عندها تحديد ما إذا كان تشكيل حرف معين نادرًا أم 
لا؛ حيث إنه كان نادرًا فإنه يتم استبعاده. ويُظهر الرسمان التوضيحيان ” و؛ نتائج 
كلتا التجربتين باستخدام المقاييس الثلاثة: درجة التشكيل؛ ونسبة الخطأ الكلمي. 
ونسبة الخطأ الحرق. 


ويمكننا أن تلاحظ أن نسبة التشكيل تتحسن بشكل كبير ( التجربتين) على 
أغلب الحالات خاصة أن أكثر هذه الأدوات لم تقم بتشكيل النصن بشكل كامل؛ 
وذلك بأسمقاء مُشكلق سكو ننه الآليين اللذين انخفضت فيهما نسبة التشكيل 

أما بالنسبة لنسبة الخطأ الكلمي فنرى انخفاضًا يتراوح بين 7-١‏ لأغلب 
الحالات؛ وقد يصل إلى 76“ 2 حالة أداة مشكالء؛ وزيادة ١‏ تقرييًا ب حالة أداة 
صخر. أما ‏ التجربة الثانية؛ حيث قمنا بخفض الحد الأدنى للندرة؛ فثلا حظ 
انخفاضًا 4 حدود 2١‏ لجميع الأدوات الست. 


وأخيرًا:نترى نسبة الخظئأ الحريق تتحفكن أيضًا بحواك 7/0 ف كلتا 

ع و 
ويّلاحظ من هذه النتاكج أن انخفاض نسبة الندرة يزيد من نسبة التشكيل 
بشكل كبيرء حيث وصلت إلى حوالي 50“ 2# جميع الأدوات الست. وهذا يُمثل تغيرًا 
كبيرا يصل إلى أكثر من 2٠١‏ لجميع الأدوات باستثناء صخر و1آ1810. ويعود ذلك 


لحلا 
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لكون خفض نسبة الندرة يُبقي على درجة أكبر من التشكيل الأصلي: وذلك قبل أن 
يتم تطبيق القواعد الاستنباطية على النص. 
ع 4 .9 3 
ويلاحظ كذلك أن انخفاض نسبة الندرة يُقلل من التحسن # نسبة الخطأً. 
سواء الكلمى أو الحريك حيث يؤدي ذلك إلى الإبقاء عل أخطاء التشكيل الموجودة 
مُسبقًا دون إزالتها. 


لحل 


تجربة أ: نسبة التشكيل 


المُحسن © الأصل 8 


تجربة أ: نسبة الخطأ في الكلمات 


المُحسن # الأصل 8« 


تجربة أ: نسبة الخطأ في الأحرف 


المُحسن ©8# الأصل ©« 


مشكال آملكخ] 


رسم توضيحي ": نتائج استخدام القواعد الاستنباطية 4 التجربة أ ( حيث تم 
استخدام ١‏ كحد أدنى 4 مرحلة التنظيف) 


لحن 
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تجربة ب: نسبة التشكيل 


المُحسن ©« الأصل 8 
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32 1 


4 2 د 
32 2 32 < 
١‏ ا ١ ١ ١ | ١‏ 


عربي حركات 


تجربة ب: نسبة الخطأ في الأحرف 


المُحسن 8# الأصل ©« 


مدى مشكال 


رسم توضيحي ؛: نتائج استخدام القواعد الاستنباطية 4 التجربة ب (حيث 
تم استخدام ٠٠١‏ كحد أدنى 4 مرحلة التنظيف) 


لمي 


ويُمكننا أن نقارن درجة التحسن لكل مقياس من جدول 4 وجدول١.‏ حيث 
فمنا ك4 حالة المقياس الأول (نسبة التشكيل)؛ بحساب درجة التحسن بطرح الفرق 
بين القيمتين ثم قسمته على القيمة الأصلية. أما 4 حالة نسبة الخطأ (سواء كانت 
4 الكلمات أو الأحرف) فقد قمنا بضرب الناتج بإشارة سالبة؛ لأن التحسن هنا 
هودرجة النقص وليس درجة الزيادة. 


جدول ه درجة التحسن 2 التجربة أ 


9 ئنسة الخطأ ئنسة الخطأ 
اسم الاداة نسبة التشكيل 3 7 5 
عربي 47 70 ٍ/غ/ 
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الخلاصة 


ذ هذا العمل البحثي قمنا بتقديم طريقة القواعد الاستنباطية: وهي قواعد 
تشكيلية تم استخراجها من أحد المكانز؛ وتحدد مدى تأثير عدد من الخصائص 
(كنوع الحرف وموقعه # الكلمة) على التشكيل. قمنا باستخدام تلك القواعد بخ 
مرحلتين: مرحلة التنظيف وهي المرحلة التي يتم فيها استبعاد التشكيل حسب 
وريه أبوكه مويله التطبيق وفيها يتم تطبيق هذه القواعد على الأحرف غير 
المشكّلة ب النص. 

وتظهر نتائج التجارب التي قمنا بها تحسنًا كبيرًا ‏ نسبة التشكيل تصل إلى 
11لا المتوستظووكدلك تحت انك ننسية التخطأ الكلمي يمتوبيظ اه نك نسبة 
الخطأ الحرك بمتوسط .72٠١‏ 
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الترجمة الآلية من العربية وإليها 


أ.د. محمد زكي خضر “ 
0ع ع ]1 


الجامعة الأردنية 

حصل على البكلوريوس # الهندسة من جامعة بغداد عام 1155 وعلى الدكتوراه من بريطانيا 
عام 19177 وعمل يْ جامعة الموصل بالعراق وحصل على مرتبة الأستاذية عام 219/١‏ وهو يعمل 2# 
الجامعة الأردنية منن عام 1997. نشر أكثر من ٠٠١‏ بحث وألف ٠١‏ كتايا. عمل 4 مجال المعالجة 
الآلية للغة العربية ونال جوائز عالمية وهو عضو لي جمعيات علمية عالمية ويرأس تحرير المجلتين 
الدوليتين للتطبيقات الإسلامية ي علم الحاسوب وتقنياته باللغتين العربية والإنجليزية. 


ا 
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ملخص 


حصل تقدم هائل للترجمة الآلية خلال السنوات الماضية خاصة بين اللغات 
الأوربية. و الوقت نفسه حصل تقدم كبيرخ الترجمة الآلية للفات الشرقية 
كالصينية واليابانية والكورية. كما توفرت أنظمة متعددة مساعدة لأعمال 
المترجمين المختصين وأنظمة التصحيح اللفوي وغيرهاء مما يساعد 2# عملية 
الترجمة اليدوية. أما الترجمة من اللغة العربية وإليها فهناك محاولات للترجمة 
الآلية. لكن معظم هذه الأنظمة تنتج لغة ركيكة وغير دقيقة. 

تعتمد أنظمة الترجمة الآلية على أسس مختلفة: فبعضها يستند إلى المعاجم 
مع مساعدة نحوية لتحليل الجملة ثم إعادة تركيب ترجمتها وبعضها يعتمد الترجمة 
بالاستناد إلى الذخيرة اللغوية المحتوية على نصوص ترجمت من قبل مترجمين 
من البشر باستعمال عمليات إحصائية وغير ذلك من الوسائل حيث تمثل المعاجم 
ركيزةٌ رئيسيةً 2 الترجمة؛ إضافة إلى البرمجيات اللغوية المتخصصة. 

هذا البحث هو استكمال لبحث سابق )١(‏ ويهدف إلى تقديم فكرة عن تأريخ 
الترجمة الآلية بين اللغات العالمية وتطورها وما وصل إليه التقدم ْ هذا المجال كما 
يناقثشى الوضع بالنسبة للترجمة الآلية من اللغة العربية وإليها والمشاكل التي تعاني 
منها ومن ثم يبين الخطوات التي ينبغي اتباعها للتقدم 2 هذا المجالء ثم يعرج إلى 
مؤشرات عن مستقبل الترجمة الآلية من اللفة العربية وإليها وما يحتاج ذلك من 


جهود. 
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مقدمهة 

قال تعالى: "ناا حل السَاوَاتوالأرض واخلا سنك واكم إن بد 
ذَنكَ لأيات ماين" (الروم/77): ولذلك احتاج الناس الترجمة منذ الزمن الغابر 
اذى قد دك اديه لكات انسار اومن الكراصل بينم حفن خارحة بن ؤي بن ثابت 
قال: قال زيد بن ثابت: " أمرني رسول الله -صلى الله عليه وسلم- فتعلمت له كتاب 
يهود وقال: إني والله ما آمن يهود على كتابي: فتعلمته؛ فلم يمر بي إلا نصف شهر 

2 2 2 م 2 
خدى حدفكة مكلت أكتب ل5].4 عدن بواهرا لهذ اكتت اليه" حرؤاه أيوواودت. 


الترجمة هي نقل معاني نصص من لفة إلى لفة أخرى مع مراعاة للدقة 
والأسلوب. ويحتاج ذلك فهم النص الأصلي والتعبير عن المحتوى والأسلوب بلغة 
أخرى. فالمترجم يجب أن يتقن اللغتين المترجم منها والمترجم إليها وهو يتبع إحدى 
طريقتين: إما الترجمة الحرفية والالتزام بمعاني مفردات النصن الأصلي ونقلها 
إلى اللغة الثانية أوفهم المعنى العام ثم التعبير عنه باللغة الثانية بأسلوب المترجم 


"00 


يتعرف المترجم على الرموز المكتوبة 2 الترجمة الكتابية والأصوات المنطوقة 
4 الترجمة الشفوية:؛ لكن اللغة العربية المكتوبة بحروف غير مشكولة تستو. 
معرفة من القارىّ لكي يفهم المقصود بدون تشكيل. وهو بذلك يستعمل خبرات 
ذاتية من قواعد اللغة لكي يستعملها بشكل ذاتي وسريع. أما المترجم للكلام المنطوق 
فهويستطيع تمييز الجملة التي يترجمها إن كانت استفهامية أم خبرية أم تعجبية 
دون وجود علامات استفهام أو تعجب (؟). 


بعد ذلك يرجع المترجم ذهنيًا أوواقعيًا إلى الوحدات المعجمية وهي الكلمات 


"51١١ 


قاكليدة الوا جه قن فين ابنياء قز رعيد ها المنياق الى كرد فيه فمفاد"'عيق' 
قد تعني عين الإنسان أو الحيوان وقد تعني عين الماء وقد تعني # الصرف عين 
الفعل .)١5(‏ وهذه الترادفات تمثل مشكلة كبيرة بالنسبة للترجمة عامة والترجمة 
الآلية خاصة. 


ولحل هذه المشكلة يقوم المترجم بتحليل المفهوم للوصول إلى كنهه وما يتفرع 
عنه من ظلال # المعنى, وخاصة المجازية منها . وذلك حتى تتحدد العلاقة بين هذا 
المفهوم الأساس وما يتفرع منه وبين المفاهيم التي يمكن أن تتصل به بشكل أو بآخر. 


فالمفهوم الذي يرتبط بجسم واحد بعينه؛ أويدل عليه؛ هو مفهوم إفراديء مثل 
عطارد". أما إذا ارتبط المفهوم بعدة أجسام بينها نوع من التجانس الذي يضعها 
مجموعة واحدة؛ فإن المفهوم يكون عامًا (بمعناها الضيق هنا): مثل '"كوكب . 
فهذا المفهوم يدل على عدد من الأجسام التي تدور حول الشمس. ولتحديد المقصود 
يمكن أن يكون التعريف مركرًا أوموسمًا. وعلى ذلك فإن دقة التعريف تحدد 
المفهوم. والتعريف قد يكون شاملا 4 بعض الأحيان: و غالب الأحيان لا يخلو 
من النقصى أو أن يكون تعريقًا بالضد أوما يعرف بالتعريف السلبي أو أن يكون 
فضفاضًا أوضيقًا أويأخذ بمبدأ الإحلال والتعويضص إلى غير ذلك من الصفات 
التي يتصف بها التعريف. وهذا التعريف قد يكون واضحًا 4# ذهن المترجم وقد 
يكون مشوشا فيتصرف #4 ترجمته لهذا المفهوم وقد يعبر عنه بمفهوم يفهمه هو 
ويكون قريبًا أو بعيدًا من المفهوم الأصلي. 


ولقد سبق الإمام أبوحامد الغزالي اللسانيين المحدثين ف تحديد العلاقة بين 
المفهوم واللفظ حيث يقول: ' الشيء له # الوجود أربع مراتب: الأولى حقيقته ب 
نفسه والثانية ثبوت مثال حقيقته 2# الذهن وهو الذي يعبر عنه بالعلم والثالثة 
تأليف صوت بحروف تدل عليه وهو العبارة الدالة على المثال الذي # النفس» 


يدلا 
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والرابعة تأليف رقوم تدرك بحاسة البصر دالة على اللفظ وهو الكتابة؛ فالكتابة 
تبع للفظ إذ تدل عليه؛ واللفظ تبع للعلم إذ يدل عليه؛ء والعلم تبع للمعلوم إذ يطابقه 
ويوافقه. وهذه الأربعة متطابقة متوازية: إلا أن للأولين وجودان حقيقيان لا يختلفان 
بالأعصار والأمم: والآخرين وهما اللفظ والكتابة يختلفان بالأعصار والآمم لأنهما 
موضوعان بالاختيار" أ.ه (؟) 


كان للتطور خخ تمثيل اللغويات الذي قاده نعوم شومسكي تأثيرًا على نظريات 
اللسانيات الحديثة. فقد أعاد شومسكي تعريف الأهداف من النظريات اللسانية 
لكي تآخن بعين الاعتبار خافية المتكلمين بالنسبة للغتهم بدل البحث كذ المكانز 
اللغوية للوصول إلى المطابقة المطلوبة. فالفرد قد يسمع جملة بلغته الذاتية فيفهم 
معناها بسهولة رغم أنه لم يسمعها من قبل .)١4(‏ 


إن قواعد أية لغة محدودة لكن الجمل التي يمكن أن تركب باستخدام تلك 
القواعد لا نهاية لها. أما المتكلمون باللغة فيتعلمون بالاستنتاج؛ فمثلا يمكن للمتكلم 
ء 1 
ان يشعر بالفرق بين معنيين مختلفين 2 جملة غامضة مثل حضر ابن عمي 

1 ء ء ء ء 

الصغير فيمكن ان يقصد ان الذي حضر هو الابن الصغير للعم اوهوابن اصغر 
الأعمام. إن القواعد اللغوية يجب أن تحاكي قابلية المتكلم بلغته الأم بحيث تستطيع 
أن تميز الفموض 2# مثل هذه الجملة وأن تعطي نموذ جين للتركيبتين المحتملتين. 

وقد أجبرت الحواسيب اللسانيين أن يكونوا أكثر دقة ب وصفهم لقواعد اللغة 
التي سبق وأن تصوروا أنهم يعرفونها عن اللفة. ولكن لا يزال الشوط بعيدًا 4 دقة 
القواعد التى وصلوا إليها لتمثيل اللغة بشكل صادق. 

إن التقدم # الوصف الدقيق والمعمق للغات الطبيعية وتوفر التقنية الحاسوبية 
لمعالجة اللغات الطبيعية اجتمعا ث تكوين بيئّة مكنت من الوصف المعمق للغات مع 
أسس قواعدية لتلك اللغات. 


ولا 


تساعد بعض العمليات 4# التعرف على المفهوم مثل التعرف على الوحدات 
النحوية وعلى وظائفها مثل المسند والمسند إليه والتكملة والمضاف والمضاف إليه. 
والجار والمجرور والصفة والموصوف وغير ذلك. وعلى المترجم أن يفهم معنى كل 
واحد من هذه العناصر ووظيفته اللغوية والنحوية 2# النص.. فالصيغة الخبرية 
مثلا قد تأتي للإخبار كما تستعمل للطلب غير المباشر كما # عبارة: ' أرى أن لديك 
قلما زائدًا"؛ بل وللدعاء كذلك مثل: "رحم الله فلانًا" (4). ومن الأمور المهمة يخ 
القراحية محرقه مطل التطومجال متصسيه مكلة إذا كان النص # علم الأحياء 
فإنك تجد أن بعضن الكلمات تختلف معانيها 4 هذا النصصى عن حقل تجارة المواد 


الغذائية أو حقل من حقول العلوم الزراعية. وهكذا. 


المحور الثاني 2# الترجمة هو التعبير عن محتوى النص باللغة الهدف أي اللغة 
المترجم إليها. ويحتاج هذا معرفة بإنتاج المقابلات الصوتية أو الكتابية والنحوية 
والمعجمية والبلاغية. وعلى المترجم أن يقوم باختيار العبارات المناسبة # اللغة التي 
يترجم إليها التي توافق المفهوم الذي توصل إليه ب الخطوات السابقة. 'وعند ذلك 
تبرز براعة المترجم 2# اللغتين حيث يجب أن يتقن ما يسمى بالتقابل المعجمي أو 
الاصطلاحيء فالتعبير العربي (رجع بخفي حنين) ليس له مقابل حر بأية لغة, 
ولوترجم ترجمة حرفية لأصبحت الترجمة مضحكة. فهو يجب أن يفهم مثل هذه 
العبارات ويجب أن يعرف العبارات الدارجة التي تقابلها ب اللفة الثانية أو على 
الأقل يكوّن هو تعبيرًا من كلمات تلك اللغة بما يعبر عن المفهوم بدقة كافية مستعملا 
القواعد النحوية والصرفية خ اللفة التي يترجم إليها" أ.ه .)١(‏ 

أما التعامل مع الجمل الطويلة فهو من أهم مشاكل الترجمة حيث يحتاج ذلك 
إلى معالجات ذهنية معقدة. فحينما تحوي الجملة الطويلة على عدة مفاهيم فإن 
المفهوم الواحد ربما يتجزاً ليتكامل بين بدء الجملة ونهايتها. وقد يتضمن المفهوم 
الواحد مفاهيم ثانوية. وقد يكون المفهوم المهم مندسًا بين عدد من المفاهيم الأقل 
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أهمية منه. وهكذا فإن الجملة الطويلة ربما تستعصي على الفهم والتحليل وتحتاج 
براعة عند التركيب # اللغة المترجم إليها. 


يمكننا أن نذكر أن المترجمين لا يقومون كلهم بالخطوات نفسهاء بل إن كل 
مترجم له أسلوبه الذي يتبعه # الترجمة. ماذا نفعل تمامًا حينما نحاول فهم نص 
غير معروفة على وجه الدقة وتخضع لنظريات غير مؤكدة حتى الآن. وليس هناك 
أساليب متفق عليها حتى الآن يمكن أن ننقلها بشكل من الأشكال إلى الحاسوب ب 
الترجمة الآلية. لذلك فإن فهم النص يعتبر مشكلة كبرى 2# الترجمة: فهناك 2 
كل اللغات لبس دلالي نتيجة تعدد معاني بعض الكلمات وتحديد الجهة التي تعود لها 
بعض الضمائر .)١(‏ وهناك غموض آخر بسبب بناء أوتركيب الجملة يسمى اللبس 
النحوي. حيث تعني الجملة أكثر من معنى أو يمكن تفسيرها بأكثر من طريقة: كما 
أن هناك لبس على المستوى الصري خاصة 4# الأفعال المتعدية لمفعولين والصيغ 
بين عدة وحدات لغوية مثل تغير معنى الفعل حسب حرف الجر الذي يأتي بعده مثل 


رغب 4" و"رغب عن" ؛ وهناك مصادر أخرى عديدة للبس (0). 

إن حرف الجر قد يأخذ معاني مختلفة بين اللغات المختلفة؛ فمثلا اللام ب 
جملة: "أعطيت تفاحة لأحمد" تعني اللام '"إلى-0)" بينما ‏ جملة '"أكلت تفاحة 
لأحمد" تعني أن التفاحة هي "ملك أحمد -04 . 
الحاسوب 2 خدمة الترجمة 

الترجمة الآلية اليوم لا ترقى إلى المستوى الذي يضاهي المترجمين من البشر. 
لكن الحاسوب اليوم بإمكانه أن يقدم عونًا لا بأس به للمترجم. ومن هذا العون ما 
يأتي: )١(‏ 


نا 


.١‏ الترجمة الآلية التى تحتاج إلى تحرير لاحق؛ أى الحاجة !| اجعة 
لتر يةالتي تحتاج إلى تحرير لاحقء اي جةإلى مر 


بشرية بعد الترجمة الآلية. 


بتبسيط الجمل الطويلة وتحديد معاني الكلمات ذات المعاني المتعددة. 


3 التحاور مع الآلة بين المترجم والحاسوب» حيث هناك برامج حاسوبية 
ذوات إمكانيات حوارية بأن تعطي الترجمة جملة بعد جملة؛ ويتوقع من 
المترجم أن يوافق أو يعدل عليها. 


4. قيام المترجم بالترجمة وتساعده الآلة؛ كأن تعطي الآلة للمترجم الكلمات 
ذات العلاقة من المعجم مع مرادفاتهاء وهو يختار من بينها. 


4. الخدمات الحاسوبية الأخرى وسنورد بعض ما يتوفر من برمجيات تخدم 


نشأة الترجمة الآلية وتطورها 

كان أول من استخدم الحاسوب 4# الترجمة فعليًا هو وارن ويفر عام 
فقد كتب لك عام 1944 مذكرة لزملاته بأربعة مقترحات لتطوير أنظمة 
الترجمة الآلية لكي تتقدم أكثر من الترجمة كلمة كلمة وذلك بفحصى المفهوم 
المباشر للكلمات الغامضة. كما أشار إلى التناظر بين تركيب المخ البشري والآلات 
المنطقية ثم انتهى بأن الترجمة الآلية ممكنة التحقيق. وي تلك الفترة كانت هناك 
حاجة سريعة للترجمة غير الدقيقة نظرًا لحاجة الولايات المتحدة للاطلاع على 
اتصالات الاتحاد السوفياتي. وِي الوقت نفسه ظهرت الحواسيب. ولذلك كانت 
أنظمة الترجمة من الروسية إلى الإنكليزية أولى المحاولات: فقد أجريت بنجاح 
4 جورج تاون أول ترجمة من اللغة الروسية إلى الإنكليزية عام :١150:‏ وي عام 
06 أجريت 4 الاتحاد السوفياتي أول تجربة 4# الترجمة الآلية من الإنكليزية إلى 
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الروسية باستعمال قاموس يحوي 7٠٠١‏ كلمة. وأشارت التجربة إلى ضرورة تمثيل 
التراكيب اللغوية بمستوى بناء الجملة وبالمستوى المعجميء. كما اتضح أن مشكلة 
الغموضن. هي مشكلة فعلية رغم أنها لم تقدر حق قدرها حينئذ؛ حيث كانت الفترة 
من1505 إلى 1577 فترة التوقعات الكبيرة من الترجمة الآلية التي لم يتحقق ما 
كان يؤمل من الحصول على دقة بنسبة 46/ دون معالجة مسبقة للنصوص. لقد 
أوضحت الأبحاث أن تركيب اللغات أكثر تعقيدًَا مما كان متصورًاء وأن المترجمين 
من البشر يستعملون الكثير من المعرفة ث4 حقل المادة المترجمة والمعرفة بالحياة 
العادية أكثر مما كان متصورًا. وأدى ذلك إلى تباطؤ# أبحاث الترجمة الآلية 
وربما إهمال الموضوع حتى عام .)١( 1١510‏ 


عادت الأبحاث على أشدها # أوربا وكندا واليابان بين عامي 19175 و15/4 
باستعمال الأنظمة الخبيرة وأبحاث معالجة اللغات الطبيعية؛ وبشكل خاص للغات 
الأوربية واليابانية؛ وبذلك ظهر الجيل الثاني من برامج الترجمة الآلية فظهرت ب 
الأسواق برامج تجارية تستعمل الحواسيب. وهذا التطور شمل البحوث المعجمية 
والنحووالصرف والدلالة. 

و عام 1984 كانت بداية الجيل الثالث من برامج الترجمة الآلية التي استندت 
إلى المعلومات الإحصائية حينما قامت شركة 18131 (719): بمشروع 0106صة©) 
المستند إلى الترجمة بالأمثلة والترجمة المحدودة الموضوع مع تعدد اللغات المترجم 
منها والمترجم إليهاء فازداد الاهتمام بالترجمة الآلية لحد لم يسبق له مثيل. وقد 
استندت هذه الترجمة إلى الذخيرة اللغوية 83560 115م001) والتي لا تزال 4 تطور 
حتى اليوم مع بعض التكامل مع الأساليب الأخرى للترجمة الألية .)١(‏ 

أما الترجمة من اللغة الإنكليزية إلى العربية فقد كان أول ظهورها 4 نهاية 
السبعينيات خ ولاية يوتا الأمريكية؛ ولم يكن يحتوي البرنامج على تحرير أولي: 
لكن كان بالإمكان إجراء تحرير نهائي. وقد احتوى النظام على مرحلتين الأولى 
لتحليل اللغة المصدر والثانية لتوليد اللغة الهدف. كان تحليل اللغة الإنكليزية 


/ا51؟" 


موجهًا لكي يولد العبارات 2# اللغة الهدف بشكل مباشر باستعمال معجم ثنائي 
اللفة للعبارات. ولم تكن الألفاظ والجمل الإنكليزية تحلل بعمق؛ بل فقط بما يكفي 
لتوليد المقابل باللغة العربية. وهكذا كان النظام باتجاه واحد ولم يكن يفوص بعمق 
4 اللغة المصدر. وقد استعمل البرنامج لترجمة الموسوعة البريطانية ( بريتانيكا) 
إلى اللغة العربية .)١4(‏ كما قامت سلطنة عمان بالحصول على امتياز للبرنامج 
لكي يستعمل # ترجمة الوثائق الإنكليزية إلى العربية. 

لم تكن الطريقة المباشرة 4# الترجمة تفوص 2# أعماق اللفة المصدرء. ومن 
ثم أدرك مطورو البرمجيات أن الطريقة المباشرة لا تكفي لمعالجة اللغات الطبيعية 
المعقدة. فقد وجد أن التعامل مع الجمل باستبدال مواقع الفعل بين الإنكليزية 
والعربية مثل 00116 011215 411 فترجمتها إلى: ' يشرب علي القهوة" احتوى على 
استبدال موقع الفعل والفاعل لكن ذلك لا يكفي 2 جملة مثل: 


الفط خطاع 11 قط ما 1125 2 ع ماتتتتدء لطنة ع1تهل عه دعطاماء عومطن6 6037 عط 1" 


.ع2 مغ 0م1311 


فمثل هذه الجملة تحتاج إلى تحليل عميق لتحديد الفاعل ومن ثم اقترانه بالفعل 
حيث بينهما عدد كبير من الكلمات. وعلى ذلك فإن الطريقة المباشرة لا تعطي نتائج 
دقيقة لمثل هذه الجمل الطويلة: لذا فقد برزت حاجة لتطوير المعرفة بكيفية تحليل 
الجمل الطويلة بعمق وكفاءة دون غموضء وعند ذلك ظهرت الطريقة التحويلية التي 
قدمت للترجمة الآلية أمرين: الوصف لتحليل الجملة ومن ثم التقنية الجديدة لتمثيل 
هذا التحليل العميق. وهو ما طور خلال السبعينيات والثمانينيات من القرن الماضي. 

إن استعمال أنظمة الترجمة الآلية قليلة الدقة يدفع إلى -بشكل مطرد- 
للاستهانة بمترجمين من البشر. وقد وظفت بلدان كشيرة الترجمة الآلية لخدمة 
متطلباتها الاجتماعية والاقتصادية والعلمية والتقنية 4 طليعتها الولايات المتحدة 
وروسيا والصين واليابان (١و؟؟)‏ . 
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لقد أجريت منذ الثمانينيات # القرن الماضي العديد من الأبحاث حول 
المعالجة الصرفية للغة العربية وكان معظم تلك الدراسات ينصب على عملية 
فصل السوابق واللواحق # الكلمة العربية المركبة, ومن ثم استخلاص الجذر 
لمعرفة العمليات الصرفية التي أجريت عليها والتي يمكن للحاسوب القيام بها بعد 
برمجته بشكل دفيق. 

قام كيفن نايت ودانيال ماركو بتحويل الأبحاث العلمية المتعلقة بالترجمة الآلية 
إحصائيًا ‏ عام ٠٠١”‏ إلى منتج للترجمة الآلية من العربية إلى الإنكليزية؛ وكان 
ذناق مكالا عِير| لتكوكى :5 خيرة لغؤية مقائلة يق الشريية والإتكليوية والاستفادة 
منها للترجمة الآلية. 

كما وجد أن استكشاف أسماء الأعلام والبيانات المعروفة ببرنامج خاص 
يمكن أن يحسن من الترجمة:؛ فما أن يكتشف مثل هذا الاسم حتى يمكن القيام 
بعدة عمليات تفيد 4# الترجمة؛ فمثلا عند اكتشاف أن كلمة مثل "أحمد'" هي اسم 
علم فإنها لا تترجم على أنها 8156:م 1 

كما ظهرت بعض الأنظمة الهجينية (4؟) التي تستعمل للترجمة المكتوبة 
والمنطوقة باستعمال الطريقتين: الطريقة الإحصاتية والطريقة المستئدة إلى 
القواعد (230955).؛ وبعد النظر إلى كل من الطريقتين من ناحيتي الفوائد والمضار 
يمكن المزاوجة بينهما للحصول على الفوائد من كليهما واستبعاد المضار .)١7(‏ 

هناك الآن# الأسواق أعداد كبيرة من برامج الترجمة الآلية بين اللغات الأوربية, 
وقد ازداد الطلب عليها بشكل واسع وساهمت شبكة الإنترنيت بزيادة الحاجة إلى 
الترجمة الآلية وسهلت # تبادل المادة المترجمة إلى من يحتاجها . ولا يزال التقدم 
على أشده # تكامل عمل المترجمين من البشر مع الترجمة الآلية. حيث يحتاج التقدم 
بمستوى الترجمة الآلية إلى مترجمين أكفاء لتطويرها والارتقاء بها (1). 
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يحتاج المجتمع البشري اليوم إلى كمية هائلة من المعلومات التي يراد ترجمتها 
بما يفوق ما يتوفر من مترجمين من البشر خاصة بعد تفجر ثورة المعلومات وتنوع 
اللغات التي تساهم 4# إنتاج المعرفة اليوم وما يحتاجه من لا يتكلمون تلك اللغات. 
ورغم التأريخ الحافل للغة العربية ‏ مساهمتها # المعرفة البشرية: لكنها اليوم 
ليست المصدر الأهم 4# العلوم والتقنيات الحديثة. وهذا يجعل عملية الترجمة 
من اللغات الأخرى إلى اللغة العربية ذات أهمية بالغة للناطقين بالعربية؛ فإمًا أن 
يتعلموا لغة أولغات أخرى بجانب العربية أو أن يترجم لهم ما يصدر من معرفة 
باللفات الأخرى. فالتخلف 4# الترجمة إلى اللغة العربية يفسر الإقبال الشديد 
على تعلم اللغة الإنكليزية خاصة والتدريس بها 4 الجامعات والمدارس 24# كثير من 
الأقطار العربية .)١(‏ 

يضاف إلى ما سبق سبب ثان 2# أهمية الترجمة الآلية هو أن عملية الترجمة 
مملة للمترجمين وتستهلك الأوقات الطويلة منهم: فهم يحاولون التغلب على المل 
بتغيير أسلوب الترجمة أو بالراحة. والمترجم حاله حال البشرء ينام ويمرض ويغير 
عمله ويتقاعدء وهذا يجعل المترجمين من البشر بضاعة نادرة. كما أن غالبية 
المترجمين يتقنون لغة واحدة مع اللغة الأم. وهذا بخلاف الآلة التي يمكنها أن تعمل 
الوقت الطويل ويمكن استبد الها بما هو أكفاً منها مع التقدم التقني المستمر إذا ما 
تقادمت .)١(‏ 

وهناك أسباب أخرى منها أن المؤسسات الضخمة ترغب 4 استعمال 
مصطلحات وعبارات محددة ينبغي أن تعاد كلما مرت تلك العبارات: والمترجمون 
من البشر عادة يحاولون تغيير أساليبهم ابتعادًا عن الملل؛ إضافة إلى أسباب 
اقتصادية وتجارية 4 استعمال الترجمة المستندة للحاسوب حيث تزيد من حجم 
ومن سرعة ما يراد ترجمته مما يحقق للمؤسسات والشركات انتاجية عالية بسرعة 
هائلة: كما أن حاجة القطاع التجاري قد تكون إلى ترجمة تعطي فكرة عامة عن 
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المنتجات الصناعية والتجارية دون أن تكون على درجة عالية من الرصانة. يجري 
هذا مع ازدياد حجم مثل هذه المعلومات المطلوب ترجمته ا وتوسعها لتشمل لغات 
جديدة .4 عصر العولمة. وهذا ما يجعل الترجمة الآلية رغم انخفاض كفاءتها 
مفيدة (١و؟؟).‏ 


5. مستويات برامج الترجمة الآلية وأنواع منها 


يمكن تصنيف برامج الترجمة الآلية بحسب مستوياتها التي تعكس مدى 
تعقيدها ومدى كفاءتها 4# الترجمة إلى الأصناف الآتية بشكل تقريبي (3و7؟): 


المستوى الأدنى: تستدعي الترجمة الآلية البدائية ترجمة كلمة لكلمة دون 
أية معالجة آلية قبل ذلكء ويمكن بعد ذلك للمترجم البشري أن يفهم من المادة 
الناتجة المقصود من العبارات فيقوم بإعادة صياغتها بشكل جديد بحيث يعيد 
ترتيب الكلمات والعبارات ويولد الجملة المطلوبة ويقوم بالتأكد من دقة وسلامة 
الجملة. وهذا المستوى يحتاج إلى معجم ثنائي اللغة ضخم ومعجم للكلمات التي 
تحتاج أكثر من كلمة تقابلها. 

المستوى التالي الأعلى من المستوى الأدنى: 2 هذا المستوى تجرى بعض المعالجات 
الصرفية لغرض التعامل المخفي مع الكلمات. ويمكن اعتبار الترجمة بالأمثلة ضمن 
هذا المستوى بوجود ذخيرة من جمل وعبارات متوازية. 

المستوى المتوسط الأول: يحتاج هذا المستوى إلى شجرة إعراب للجملة (محلل 
نحوي) باللغة المصدر ومن ثم تسقط على اللغة المترجم إليها. 

المستوى المتوسط الثاني: 2# هذا المستوى هناك حاجة للتمثيل الدلالي بين 
اللغات: فمثلا إذا قلنا "رأسي يؤلني" بالعربية: فترجمتها بالإنكليزية هي 11876 
81 والتي تترجم حرفيا إلى "لدي صداع"". وعلى هذا فمن الضروري فهم 
المعنى وتمثيله بشكل سليمء لكي يمكن إيجاد المرادف له # اللغة الأخرى. 
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المستوى الأعلى: لا يزال البحث # هذا المستوى يجري. وذلك للأخذ بعين 
الاعتبار الأساليب البلاغية العميقة # اللغتين؛ وتكاد تعاني كل برامج الترجمة 
الآلية حاليًا من قصور ع هذا الجانب (؟5). 


وك كل الأحوال على برنامج الترجمة الآلية أن يقوم بعمليتين رئيسيتين: 
.١‏ النقل: أي عملية إيجاد ما يقابل كلمات وعبارات وجمل النص الأصلي. 
وكذلك إيجاد التراكيب النحوية المقايلة للتراكيب الواردة فيه. 


؟. أما العملية الثانية فهي صياغة الجمل الناتجة من عملية النقل السابقة 
صياغة صحيحة صرفيًا ونحويًا وأسلوبيًاء مثل صياغة: (عامل) + (جمع) 
صورة (عمال) و (معلم) + (جمع) + (حالة النصب أو الجر) ب 
صورة ( معلمين) ؛ وكذلك وضع الصفة # العربية بعد الموصوف ومراعاة 
قواعد المطابقة اللازمة (١و؟).‏ 


وفيما يأتي تفصيل لأهم أساليب الترجمة الآلية المستعملة اليوم. ونشير إلى 
أن كل هذه الأساليب ما زالت قاصرة إن استعملت لوحدهاء لذلك فمن الضروري 
للارتقاء بالترجمة الآلية اعتماد أكثر من أسلوب بشكل متوازي لرفع مستوى 
الترجمة خاصة لفك الغموض (١”و8؟).‏ 
الترجمة باستعمال لغة وسيطة 

تستند لغة التشبيك العالمية (77) إلى تحويل اللغة المصدر إلى لغة تمثيل 
للنص لا يعتمد على أية لغة. ومن ثم يمكن ترجمة هذه الرموز إلى أية لغة أخرى, 
وهذا يعني أن هذه الطريقة يمكن أن تخدم الترجمة إلى لغات متعددة بالتوازي» 
بينما تحتاج الطريقة الإحصائية التي سيرد ذكرها فيما بعد إلى جهد وذخيرة 
لغوية متوازية بين كل لغتين يراد الترجمة بينهما. إن التحدي الذي تواجهه هذه 
الطريقة هوتكوين لغة تمثل المقصود باللغات كلها دون لبمس لكي يمكن الترجمة 
منها. يحتوي برنامج الترجمة بهذه الطريقة على ثلاثة أجزاء هي: 


ضي 
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الوحدات اللغوية والتي تضم المعاجم التي تحتوي على كلمة عالمية تمثل المفردات 
العالمية وتضم القواعد النحوية لتحويل اللفات الطبيعية إلى هذه اللغة العالمية بما 
ذلك من علاقات وأوصاف وملصقات وكل ما تحتاجه اللغات الطبيعية لكي تكون 
عبارات فصيحة وواضحة ومفهومة 3# اللغة المراد الترجمة إليهاء وهذا ما يستدعي 
وجود قاعدة معرفة هرمية الشكل للمفاهيم الموجودة 4# اللغات الطبيعية. إن هذه 
اللغة هي لغة اصطناعية يمكن بوساطتها العبور نحو اللغة الهدف وتتمثل كفاءتها 
ال دقة تمثيل اللغة المصدر ومدى إمكانيتها لتحويل ذلك التمثيل إلى اللغة الهدف. 

إن الفكرة وراء الترجمة الآلية المستندة إلى التحويل (؟) هي أن يكون هناك 
تمثيل وسيط يلتقط معنى الجملة الأصلية بحيث يكون وعاء للمعرفة لا يعتمد على 
لغة معينة ولا على حقل معين لغفرض توليد الترجمة الصحيحة. ويمكن تحسين 
الترجمة بصياغة المعرفة اللغوية وتزويد الحاسوب بقواعد كافية للتعامل مع 
الخصائصى اللغوية. إن قوة هذه الطريقة الحقيقية هي 2 إمكانية تمثيل المعرفة 
بهذه اللغة الوسيطة. 

تعتمد الطريقة على تمثيل النص من اللغة المصدر بشكل شبكة نحوية كلية 
باستعمال لغة تسمى لفغة التشبيك الكلية والتي يمكن بعد ذلك تحويلها إلى أية لغة 
أخرى (/707). 

وقد جربت هذه الطريقة على نحو ٠٠٠١‏ صفحة من موسوعة أنظمة دعم 
الحياة إلى اللغات الستة التي تدعمها وثائق اليونسكو وكانت النتائج لا بأس بها. 
وعلى هذا فحينما يكون المطلوب ترجمة نص لعدد من اللغات فإن التحويل بهذه 
الطريقة قد يكون خيارًا مفضلًا .)7١(‏ 
الترجمة الآلية المستندة إلى الاحصاء 

تحتاج هذه الطريقة الحديثة لجمع أكبر ما يمكن من ذخيرة لغوية ( 6010105 ) 
والقيام بجهد إحصائي كبير عليها لكي تصبح مناسبة للاستخدام 4 الترجمة 


يخي 


الآلية. وبالطبع فإن الذخيرة المترجمة هي بالأساس مترجمة من قبل مترجمين من 
البشرء وهي بذلك تستخلص خبرات البشر للإغادة منها 2# الترجمة الآلية .)١(‏ 


تعتبر الذخيرة اللغوية لأية لغة مرتكرًا أساسيًا اليوم للباحشين 2# اللغات 
الطبيعية. فالخزن على الحواسيب جعل جمع وتصنيف وتحليل الذخيرة اللغوية 
ميسورًا. وهذه الذخيرة تمكن الباحثين من إطلاق الوصف على خصائص اللغة 
وعلى النحووفيها ودراستها تاريخيًا وتفيرها مع الزمن (؟١).‏ 

تجمع الذخيرة اللغوية المناسبة (يجب أن تكون من الضحامة ما فيه الكفاية) 
النحوية والصرفية. وعلى هذا فيتوقع منها أنها تمثل اللغة بشكل تقريبي. ونظرًا 
لاعتماد هذه الطريقة على الذخيرة ثنائية اللغة ( أو متعددة اللغات): فيجب أن 
تكون هذه الذخيرة شاملة وواسعة ودقيقة. وهو أمر يك غاية الندرة. وتتوفر مثل هذه 
الذخيرة اليوم 2 اللغات العالمية الأخرى غير العربية لضخامة ما يتوفر من كتابات 
محوسبة كالصحف والمجلات والكتب المطبوعة والمقالات المنشورة على الإنترنيت 
والإعلانات ونشرات الشركات التجارية وهي تمثل اللغة: ومن ثم تستفيد الترجمة 


الآلية من مثل هذه الذخيرة .)١59١6(‏ 


إن الحجم الأدنى للذخيرة التي يمكن الاعتماد عليها لغرضن الاستعمال ب 
الترجمة يبلغ مئات الملايين من الكلمات. وبهذا الصدد لا تزال الذخيرة اللغوية 
المتوفرة باللغة العربية مع ترجماتها للغات الأخرى محدودة. 

هناك عدة أنواع من الترجمة الإحصائية؛ فمنها المباشرة التي تستند إلى 
معجم عبارات للغتين. أما الترجمة الإحصائية غير المباشرة فيجري فيها القيام 
بعمليات تحويل لغوية عديدة للإفادة من الذخيرة كالتحويلات الصرفية والنحوية 
والدلالية وحذف السوابق واللواحق والقيام بعمليات إحصائية واستعمال الأنظمة 
الخبيرة. كما أن هناك الترجمة الإحصائية بالأمثلة التي تحتاج للقيام بإعراب 
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الجملة بلغتها الأصلية ثم القيام بعدد من التحويلات بإعادة السلسلة الظاهرية 
اللغة الأصلية لكي توافق التسلسل المطلوب 2 اللفة المترجم إليها. وتجرى هذه 
العمليات على الجزء من الذخيرة المستعمل للتدريب وكذلك على النصوص المراد 
ترجمتها ويحتاج ذلك لحل مشكلة تقابل عدة كلمات # لغة مقابل كلمة 3# اللغة 
الأخرى وبالعكس .)١7(‏ 


اعد 


تستند عملية تهيئة الذخيرة حاسوبيًا على استخراج الكلمات المكررة وغير 
المكررة ك4 الذخيرة (1؟9؟5) ثم بعد ذلك الحصول على قائمة بكل كلمتين 
متعاقبتين ثم قوائم العبارات المتقابلة بين اللغات المراد الترجمة منها وإليها. 
وبالطبع فإن هذه الطريقة بأسلوبها المبسط لا تعطي ترجمة دقيقة وهي بحاجة 
إلى معلومات نحوية وصرفية لزيادة الدقة. وقد استعملت هذه الطريقة ‏ ترجمة 
محاضر البرلمان الكندي بين اللغتين الفرنسية والإنكليزية فوجدت ناجحة لحد 
كبيرء وذلك بسبب أن موضوع التحاور # أروقة البرل مان ذو نمط معين وبأساليب 
متعارف عليها بين المتحاورين .)١(‏ 

إن الخطوة التالية 4 معظم برمجيات الترجمة الآلية المستندة إلى الإحصاء 
بعد استكمال الذخيرة اللفوية المتوازية هي توليد الكلمة المقابلة بين اللغتين وحل 
مشكلة عدم تساوي غدة الكلماث بين اللعكين (1). 

تعتمد دقة الترجمة الإحصائية على نوع ودقة الذنخيرة المستعملة وعلى 
البرمجيات المستعملة فيها .)7١(‏ ويجدر بالذكر أن تغير اللغة والمفردات المستعملة 
بمضي الزمن وضحامة الذخيرة المطلوبة يستوجب وجود معجم تأريخي للغة. 
كمثشال على ذلك فإن كلمة ' السيارة" حين ترد ب نص مكتوب قبل قرون تعني 
غير "السيارة" المكتوبة ب نص مستعمل اليوم. وكذلك فإن استعمال بعض أسماء 
الأعلام يحتاج وجود قرائن + البرنامج لكي يقوم بترجمتها بمعناها وعدم 
اعتبارها أسماء أعلام. فمثلا كلمة: "أحمد" # جملة "أحمد الله على نعماته 
هي ليست إسم علم. ومن الصعوبة بمكان على الآلة تحديد هل الكلمة ذات معنى 
أم اسم علم بدون قرائن كافية. 
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الترجمة بالأمثلة 

الترجمة المعتمدة على الأمثلة تستند إلى ترجمة جمل قصيرة باستعمال ذ خيرة 
لغوية ضخمة مبوبة على مستوى العبارات وقد استفيد من وثائق الأمم المتحدة 
متعددة اللغات بهذه الطريقة. لا تعتمد هذه الطريقة من الترجمة على الهيكلية: 
حيث أن الأمثلة تخزن بشكلها السطحي مع تعاملات صرفية وتجزئة للكلام 
محدودة. حيث تقابل كل جملة مع ترجمتها باستعمال عمليات صرفية محددة. 
وتجري عملية المقابلة بالرجوع إلى خوارزمية تحدد المعاني التقريبية للكلمات بدل 
استعمال معاجم ثنائية اللغة. وأهم ما هذه الطريقة أنها تحاكي الطريقة التي 
يفكر بها المترجم البشريء فالذخيرة التي تستند إليها هذه الطريقة هي القوائم 
متعددة اللغات للكلمات والعبارات والجمل المتوازية. وتقوم الترجمة بإيجاد المقابل 
للنصى المطلوب ترجمته من القوائم المتوفرة. وهذه العملية تسمى التحويل؛ تليها 
عملية دمج العبارات المختلفة لتوليد النص النهائي باللغة الهدف .)١(‏ 

إن الترجمة بالآمثلة لا يمكن أن تعتبر كافية لإتمام عملية الترجمة كاملة: 
لكنها يجب أن تتم مع طرائق أخرى للترجمة بحيث يكمل بعضها بعضًا. وتستند 
هذه الطريقة إلى إجراء أبحاث على الذخيرة اللغوية لاستخلاص الأمثلة والعبارات 
الشائعة المتقابلة بين اللغتين المراد الترجمة بينهماء إضافة إلى استخلاص قوالب 
نحوية بين اللغتين لتعويضني الكلمات المقابلة بين اللغتين. هذه الطريقة فعالة ب 
الغاذة للكويجنة بين اللغات: الف قدو لأضوق لاتينية متلا لكق الأمى يردا د ضعوية 
بين اللغات التي تعود إلى عوائل مختلفة. 
الترجمة الآلية واللغة العربية 

تمتاز اللغة العربية بميزات خاصة مختلفة عن اللغات الأخرىء. و4 الوقت 
نفسه تجمعها مع اللغات الأخرى ميزات عامة:؛ لذلك يمكن الاستفادة من هذه 
الميزات العامة مع اللغات الأخرى والبناء عليها لتغطية خصوصيات اللغة العربية 


احلا 
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سواء 4 الترجمة من العربية أو الترجمة إليها. فمن الأمور المشتركة بين عدد من 
اللغفات تعدد المعاني للكلمة الواحدة ووجود جمل ليس فيها فعل. كما تحوي اللغة 
العربية على عوامل صرفية عديدة منها السوابق واللواحق والأواسط وتغيير صيغة 
الكلمة. هذا يعني أن أية ترجمة آلية يجب أن تحوي تحليلا قويًًا للوصول إلى الجذر. 


إن الترجمة الجيدة يجب أن تقتنص المعنى بكفاءة: ونعني بالكفاءة الوصول 
إلى المعنى المقصود بدقة باستخدام أكبر ما يمكن من قرائن. .وهذا ما تفتقده 
أنظمة الترجمة الآلية بالوقت الحاضرء وهوما يضع عبمًا على من يقوم بالتصحيح 
بعد الترجمة؛ والذي قد يكون أكثر مما يمكن أن يبدل بالترجمة البشرية أحيانًا 
إذا كانت الترجمة سيئة. 

أما خصوصيات اللغة العربية ذات العلاقة بالترجمة اليوم فمنها غياب 
التشكيل رغم أنه جزء رئيسي من النص المنطوق؛ مما يفرض على القارئٌ افتراض 
تشكيل من عنده بما يملكه من شروة لغوية. وهوما يقوم به المترجم كذلك؛ مما 
يستدعي إيجاد بديل لذلك # الترجمة الآلية .)٠١(‏ ويزيد الأمور تعقيدًا ندرة 
استعمال علامات الوقف والفواصل 4# النصوص العربية. 

كما تمتاز اللغة العربية بدمج السوابق واللواحق والإدغام والإقلاب وغيرها. 
أما الجمل الطويلة 4 اللغة العربية فتحتاج إلى عمليات حاسوبية معقدة لتحليلها 
مما يؤدي إلى أن تصبح المعالجة بطيئة. ومن العمليات التي تساعد 2 ذلك تقسيم 
الجملة إلى عبارات المضاف والمضاف إليه والجار والمجرور وأشباه الجمل .)١١(‏ 

أما من الناحية التأريخية فإن التغييرات التي صاحبت اللغة العربية كانت أقل 
بكشير من لغات أخرى كالإنكليزية التي شهدت تطورًا هائلًا خلال القرون الأخيرة 
بالمقارنة مع اللغة العربية التي لا يزال تراثها المكتوب منذ صدر الإسلام ولحد الآن 


لم يحدث عليه تغيير جوهري 3# المفاهيم العامة. 


يفف 


ولغرض أن تكون الترجمة الآلية مقبولة يجب القيام بعدة عمليات على النص 
العربي برمجيًاء منها على سبيل المثال لا الحصر ما يأتي (؟١):‏ 


ل إضافة الرموز للنص كالفوارز والفواصل والنقاط ومعالجة الهمزات 
والتفريق بين الهاء والتاء المربوطة والتشكيل للأحرف التي فيها لبس. 


©»ء مراعاةة وجود السوابق واللواحق وتحديد أجزاء كل منها إن وجدت كألف 
لام التعريف وحروف العطف وحروف الجر المتصلة والضمائر وعلامات 


©» مراعاة قواعد تغيير كتابة الكلمة بعد الحاق بعض الضمائر المتصلة مثل 
كلمة " تبة- 7 1 "اعم عله 

تحديد فيما إذا كان العدد المتضمن ضمن الكلمة مفردًا أو مثتى أو جمعًا 
وذلك من خلال علامات الجمع الواو والنون والياء والنون وعلامات 
المثنى من خلال الألف والنون والياء والنون وغيرها. 

تحديدالمعنى عندما يكون هناك وجود لأكثر من احتمال .4# تحديد الكلمة 
المراد ترجمة معناها مثل الكلمات التي تعطي أكثر من معنى باختلاف 
التشكيل كأن يكون الفعل مبنيًًا للمجهول أو للمعلوم أو أن يكون اسمًا أو 
فعلًا مثل: ذَّهَبّ وَذَّهَبٌّ (1). 


التحليل النحوي لتحديد التركيب الدقيق للعبارة أو الجملة حيث يقوم 
البرنامج بتطبيق قواعد منطقية بهدف الوصول إلى الترجمة باللغة 
الهدف. 

الربط بين تركيب الجملة ومركباتها الدلالية لغرض الوصول إلى الترجمة 
الهدف. 

التركيب المنطقي بتمثيل الجملة الأصلية باللغة الهدف. 


الس 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


تحسين الجملة باللغة الهدف نحويًا وصرفيًا ودلاليًا. 


الأبحاث 24 الترجمة من اللغة العربية وإليها 

اهتمت ف الآونة الآخيرة كثير من الجامعات الأمريكية والأوربية والعربية 
بمعالجة اللفغة العربية حاسوييًا والترجمة منها وإليها. وتتوزع الأبحاث على 
النحووالصرف والدلالة والترجمة وجمع الذخيرة اللغوية وأساليب تكوين المعجم 
المحوسب وعملية الاستفسار باللغة العربية وتكوين الخلاصات وغيرها .)١(‏ 


إن الكلمات العربية المركبة غالبا ما تتكون من سوابق ولواحقء وحيث إن عملية 
فصل هذه اللواصق فيها كثير من الإبهام؛ نذلك هناك حاجة للرجوع إلى المعنى 
بالإضافة إلى القواعد الصرفية والنحوية. كما أن عملية فصل اللواصق تزداد 
صعوية 2# العربية بسبب غياب التشكيل عادة. 


تقع عملية فصل اللواصق 4# ثلاثة أصناف: صنف يستند إلى قواعد وصنف 
يستند إلى الإحصاء وصنف يعتمد المعجمية كأسامس له. الصنف الذي يعتمد 
القواعد يستند على المعرفة اللغوية المأخوذة من الخبرة البشرية بحيث تحول هذه 
المعرفة إلى قواعد وهذه القواعد معروف أن الوصول إليها ليس بالسهولة بمكان؛ 
كما إن الكثير من هذه القواعد ليست حدية ولها استثناءات. أما الصنف الذي 
يعتمد على الإحصاء فيحتاج إلى تدريب وبعض المعرفة البشرية لبنائه. 

لقد وجد أن القيام بعملية رصينة ب فصل اللواصق ذو تأثير أفضل بكثير من 
القيام بالعملية بشكل سطحي. ويمكن أن يتحقق تحسن آخر باستعمال أكثر من 
وسيلة من وسائل فصل اللواصق. 

إن العوامل التي تحكم ترجمة التعابير المركبة متعارف عليها لدى اللسانيين؛ 


رض 


الأسماء فإنه يجعل التعامل معها غير ممكن بشكل مباشر (17911). ويلا حظ 
أن اللغات المختلفة يمكن أن تحتوي كلمات متشابهة التسلسل وكلمات متعاكسة 
التسلسل وكلمات متشايهة التهجئة. 


ومما يجب معالجته مشكلة المتلازمات اللفظية التي يمكن تقسيمها إلى أربع 
فئّات حسب درجة التلازم؛ فالمتلازمات اللفظية المفتوحة الحرة مثل ''بادئّ الأمر" 
يمكن استبد الها ب "أول الأمر"؛ فاستبدال كلمة ' بادئ" بمرادفها "أول" لم يخل 
ذلك بالمعنى. والمتلازمات اللفظية المقيدة وهي أن ترد لفظتان معًا بحيث تستعمل 
إحداهما بمعناها الحرِي وتستعمل الأخرى بمعناها المتخصصى الذي يمكن أن 
يكون مجازيا مثلا ' يشقٌّ طريقه". ففي هذا المثال؛ لاايعني الفعل 'يشقٌ' معناه 
الشركة أن "انوكم المرء شيا إلى فتظطريق " بل معن مجاريًا هو "أن يسللك لخر 
طريك] قيهيا "+ زمفاف اعبار اه اسكركة اتخازية يك ل فوننا "وليل راي" 
والعبارات المسكوكة المحضة مثل ' وضعت الحرب أوزارها" . بمعنى انتهت وتوقفت 
إذلا يمكن هذه العبارات إبدال كلمة بكلمة أخرى أو تقديم إحداهما أو تأخير 


أخرى (7). 


ومما يجب تكوينه المعجم العربي المحوسب الذي ينبغي أن يحصر جميع المعاني 
للكلمة ودراسة مدى شيوع الكلمات ودراسة تكرار الكلمة كمادة وكفئة معجمية 
ودراسة استخدام المرادفات وشكل الكلمة وفق حالتها الإعرابية ودراسة الكلمة 
وفق اشتقاقها الصر4 ومعرفة مدى السلامة والصحة اللغوية ومعرقة المتلازمات 
اللفوية (1). كما أن المعجم المحوسب يجب أن يحوي رموزًا خاصة لتصريف الكلمة 
ومعلومات أخرى عنها تدرج فيها مفردات اللغة بالتفصيل بحيث يكون بالإمكان 
الإفادة منها حاسوييًا. 


محاولات الترجمة الآلية من اللغة العربية وإليها 
قامت محاولات عديدة للبدء بترجمة آلية من اللغة العربية وإليها. وقد أثمر 


خرف 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


بعضها بتكوين أنظمة ترجمة آلية: بينما أصبح البعض الآخر طي النسيان. وفيما 
يأتي بعض من هذه المحاولات :)١(‏ 
مصغرًا أسمته "الوله" (3). 
نظام الناقل العربي الذي طورته شركة سيموس 2# باريس للترجمة 
بين العربية وكل من الإنكليزية والفرنسية (0؟). 
ل نظام شركة أبتك عاءاممةى (57). 


نظام سيستران 5]:88/ا9 ويترجم النظام هذا الآن بين0١‏ لغة. لقد ابتدأ 
تطوير سيستران لمترجم من العربية إلى الإنكليزية 4# عام”١٠٠‏ وله 
موقع للترجمة الآن (77)؛ وقد امتاز سيستران نتيجة استعماله المكثف 
للمعاجم بقابليته لترميز مكونات اللغة التفصيلية بميزات نحوية وصرفية 
دقيقة. لكن دراسة لفحص المتلازمات اللفظية ( التي تشكل عائقًا أمام 
المترجم والمتعلم) على نظام سيستران وجدت أن النظام أخفق 4# ترجمة 
معظم المتلازمات اللفظية (17). 

٠.‏ شركة ألبمس 5م41: لديها برامج للترجمة بين عدد من اللغات. وتطبق 
ميدأ الترجمة التحاورية (8؟). 


موقعالمسبار وهو موقع يهتم أيضا بالترجمة الآلية من الإنجليزية إلى 
العربية ويالفكيسن,. ويمتاز بالسهولة والمرونة عند استخدامه اذا كانت 
العبارات بسيطة (5؟). ويرتبط موقعه مع المترجم العربي والولك. 


»ء موقع730512000]اع16 ويترجم بين": لغة )4١(‏ بينها اللغة العربية. 


بهنا (4) 4 دعم موقع الترجمنة (41)والموقع متوقف الآن؛ 


خرف 


برنامج شركة جوجل: وهوبرنامج مجاني يستند إلى الترجمة الإحصائية 
من ذخيرة لغوية مأخوذة من الإنترنيت ويتعلم من أخطائه: فإذا ما 
ترجم جملة خاطئة وأخبره المستخدم أن الترجمة خاطئة وأن المفروض 
أن تكون بشكل آخرء فإنه يخزن هذه المعلومات ويستعملها 4 المستقبل 
بشكل أصح. عدد اللغات التي يترجم منها وإليها تبلغ ٠١‏ لغة (55) بينها 
اللغة العربية. 


ترجمة بينغ: من شركة مايكروسوفت. وهي تستخدم من قبل فيسبوك 
وياهو لترجمة التعليقات. تستخدم بينغ "الترجمة الآلية الإحصائية' ؛ 
غير أنها تختلف عن ترجمة جوجل 2# طريقة تنفيذها أو البيانات التي 
تعتمد عليها. وتشمل ترجمة بينغ 4؛ لغة بينها اللغة العربية؛ وتسمح 
خاصية الترجمة التعاونية للمستخدمين بأن يصححوا أو يحسنوا 
الترجمات (49). 


مقارنة بين بعض برامج الترجمة الآلية من اللغة العربية وإليها 

سنقارن بين ثلاث برمجيات للترجمة الآلية هي جوجل وسيس تران وبينغ 
المذكورة مواقعها أعلاه. وقد اخترنا جملة عربية لترجمتها ومقارنة ترجماتها إلى 
الإنكليزية. ثم ترجمنا الجملة إلى الإنكليزية وأدخلت تلك الترجمة للأنظمة الثلاثة 
للحصول على الترجمة العربية. وقد أعيدت التجربة مرتين # شهري أيلول ( أشير 
لها بالرمز (*) ) وكانون الأول ( أشير لها بالرمز (**) ) من عام ٠١١4‏ ويلاحظ 
حدوث اختلاف 4# كل الترجمات من الإنكليزية إلى العربية # المواقع الثلاثة, 
بينما الترجمة من العربية إلى الإنكليزية اختافت 2# ترجمة جوجل وبقيت نفسها 
4 سيستران وبينغ. ويلاحظ عدم الدقة والركاكة 4# الترجمات الآلية كلها تقريبًا. 
كما يلاحظ أن الترجمة قد تختلف بمضي الزمن. 


ضرف 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


ي| حصل تقدم هائل للترجمة الآلية خلال السنوات الماضية خاصة بين اللغات 
الأوربية ذات الأصول اللاتينية لما بينها من مشتركات 

15 6025121105 عطا 01 و5وع1ع108م 00115 27عمطاءع ةا 001 
-192 18110692 3202028 65066121177 ,7:6315 ]05م عطا عسمتتتل 
-121110 ركاطةم1ء311م عط 01 عدتاوءعء5 05طتاهآ 115 5ع51128 
(*) قم 

1311 200115ع ماعن ع2230 مععط قط دوماع 10 

626612117 ,776315 0351 عط مكلك مهلغش اقصة 

255 212[ 11 5وع1328501238 2وءعم11110 212018 

(**) وأطةوماء72310 نام ممطعطا 16 


1 01111285 11325136105 21110103112 عطلا 101 55ع1ع10م 11115 
-2ة1 ندعم متنا عطا مععاعط تزالة[ععميء 0عاءه2»011 315ه:7 ]135 
اع راعء177اع5 17731 101 0115125 2111[ عط 01 511 وعع511328 
(**) ع (*) تصامل 

-5© ,776315 0351 ع1[ لاء077 1131251314101 عمتاعقحط 01 دععطه كلم 
-011 لخهآ 111 132511285 طتدءممختدظ عط عع اع6 :والقاععم 
(**) ع (*) وتتعطتءوطن؟ تتاعطا 10 قماع 


-66 8/6215 الطاععع1 0111108 06211110 21081655 700115عتاء كر 

1[ 17202صامكه “تاعطا 10 عتدل 1328113865 طتوعءم متنا اعع38ا 
0111 

حدث تقدم هائل خلال السنوات الأخيرة بين اللغات الأوروبية 

بسبب الأصل اللاتيني المشترك (*<) 

حدث هناك تقدما هائلا خلال السنوات الأخيرة بين اللغات 

الأوروبية بسبب الأصل اللاتيني المشترك (**<) 


تقدم هائل وقع أثتاء سنوات الأخيرة بين لغات أوربيٌ واجب إلى 
أصلهم لاتيني عادي (*<) 

تقدم هائل وقع أثتاء سئوات الأخيرة بين لغة أوربيٌ واجب إلى 
أصلهم عادي لاتينٌ (««) 


يضف 


التقدم هائل الذي حدث خلال السنوات الأخيرة بين اللغات الأورو 
بية بسبب أصلها اللاتيني الشائعة (*«) 


التقدم هائل الذي حدث خلال السنوات الأخيرة بين اللغات الأورو 
بية بسبب أصلهم اللاتينية الشائعة («*«) 


حال الترجمة من العربية إلى الإنكليزية؛ ينصح (45) باستخدام العربية 
الفصحى البسيطة الشبيهة بماقد يوجد # المواقع الإخبارية:, والابتعاد عن 
التعبيرات البلاغية. كما ينصح باستخدام بنية الجملة التي تبدأ بالاسم ثم الفعل 
قماية بنيّة الجملة الإكليزية كات" الرحل عناء"' يدلا مق" جاء الوجل ..فحين 
تكون الجمل العربية طويلة قد يتَبَّع الفعل أكثر من عشر كلمات قبل ورود الفاعل؛ 
مما يجعل من الصعب على الترجمة الآلية أن تنقل الفعل إلى مكانه الصحيح ب 
الجملة الإنكليزية: بل إن كثيرًا من أنظمة الترجمة الآلية تحذف الفعل بالكامل. 


برامج مساعدة للترجمة 

تخدم المعالجة الآلية للغة العربية بالإضافة إلى الترجمة الآلية: التلخيص 
الآلي والتوليد الآلي للغة واستخلاص المعلومات واسترجاع المعلومات والإجابة على 
الأسئلة والتنقيب + النصوص وتحويل الكلام المنطوق إلى مكتوب وتحويل النص 
إلى كلام منطوق والتعرف الضوئي على الحروف ... وهناك أبحاث جارية لكل 
هذه المواضيع. ومن البرامج المتوفرة الآن: برنامج التشكيل والتصحيح الآلي (10) 
136 418 ومجموعة برامج صخر للتدقيق الإملائي 01]ء00116) 5311 وبرنامج 
التشكيل الآلي (1غ) 10126111261 ع1أةدطم]نتث وبرنامج صخر للتحليل الصرٌ 
(810) وبرنامج استخراج الكلمات المفتاحية (/غ) 101ع8:]:8 01505 زعا نكاد 
ومحرك صخر للتصنيف الشجري "سراح" ومحرك صخر للتلخيص الآلي وبرامج 
تنقيب ووصف الكلام (5غ) 12858128 داءعءءم5 231101 . وهناك برامج التحليل 
الصر لتحديد جذور الكلمات والمعلومات الصرفية والنحوية ومن هذه البرامج: 


تغرف 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


برنامج ) 1 0( 0+ حيث يستخدم ذخيرة للألفاظ وتحليل احصائي 
لفك الغموض ومحلل )0١(‏ <10ع2 8665167 وهو مولد ومحلل صر مساعد 2 
التعليم وبرنامج باك وولتر للتحليل الصرك (02) وبرنامج التنقيب 4# النصوص 
للوصول إلى الأفكار الأساسية وبرنامج محرك البحث النصي العربي (؟9) 515116 
وبرنامج 101011055 413 الذي يقوم بتحليل الكلمات العربية إلى وحداتها الصرفية 
ثم يربط كل الأشكال الصرفية بمادة المعجم المقابل لها وفق الجذر (04)»؛ وبرنامج 
معتمدًا على تشكيل آلي (50)؛ وبرنامج إبصار للمعاقين بصريًا والمكفوفين (5؟). 


ترجمة الكلام المنطوق 

تتوفر 2 الأسواق بعض القواميس الصوتية لترجمة عبارات بين لغات متعددة 
بينها اللغة العربية. وكثيرًا ما تحتوي عبارات باللهجات العامية. ويمكن استعمال 
بعض الأنظمة الصوتية 4 حجز الفنادق والحجز على الخطوط الجوية والمشاركة 
المؤتمرات وطلب الطعام من المطاعم والاستفسار عن اتجاه السير والحجز 
لدى العيادات الطبية والمستشفيات واستتجار السيارات وغيرها (19). إن مشاكل 
ترجمة الكلام المنطوق تزيد على مشاكل النصى المكتوب: وذلك لأن الكثير من 
الكلام المتداول يحوي أخطاء نحوية أو جملا ناقصة. ولغرض تكوين ترجمة آلية 
فورية: يجب وضع قواعد عامة ذات مرونة لا تلتزم بقواعد اللغة بصرامة: وذلك 
للأخذ بعين الاعتبار تحديد نطاق الكلمات التي يستعملها المتكلم وطريقة نطقها 
وسرعة النطق وطول الجملة وصيغ التوقف بين الجمل. وهناك محاولة لاستعمال 
الرسائل القصيرة على الهاتف النقال للترجمة وتمتاز بأنها قصيرة ومحدودة 
المعجم» وبآنها قابلة للتطور والتوسع .)3١(‏ ولا تزال الأبحاث لمثل هذه الأنظمة ل 
مراحل التطوير. 


نارف 


الاستنتاجات وال مقترحات 

الترجمة الآلية من اللغة العربية وإليها إحدى الوسائل التي تكمن فيها خدمة 
كبيرة 4# نهضة الأمة وأجيالها المستقبلية وذلك لآن اللغة العربية اليوم ليست هي 
اللغة العالمية للعلوم والتقنية: غما يصدر ي اللغات الأخرى وخاصة الإنكليزية من 
أبحاث ودراسات وكتب ومؤلفات أخرى يحتاج للترجمة للغة العربية. كما أن اللغات 
التي يتكلم بها المسلمون بحاجة إلى التراث العربي الإسلامي غير المتوفر 4 تلك 
اللغات وهناك حاجة ماسة لترجمته. لذلك فالترجمة الآلية من اللغة العربية وإليها 
ليست من الكماليات بل هي من الضرورات القصوى لنهضة الأمة وعودتها لمكانتها 
بين الأمم. وأول ما تحتاجه الترجمة الآلية هووجود معجم عربي محوسب وتكوين 
ذخيرة متعددة اللغات مع العربية لتساعد 4# الترجمة الآلية المستندة إلى الإحصاء 
ودعم الأبحاث اللغوية المتعلقة بالترجمة الآلية من اللغة العربية وإليها. ولغرض 
الوصول إلى ذلك هناك حاجة إلى القيام بحملة توعية للقيادات السياسية والعلمية 
والجهات الداعمة للبحث العلمي على أهمية البحث العلمي 4# حوسبة اللغة العربية 
من قبل المجامع اللغوية العربية وأقسام الحاسوب واللغة العربية واللسانيات ‏ 
الجامعات العربية كما ينبغي توجيه الأبحاث نحو التطبيق العملي وتكوين قيادات 
بحثية # أقسام اللغة العربية ذات خلفية حاسوبية جيدة وك أقسام الحاسوب ذات 
خلفيات جيدة باللغة العربية لكي يكون التواصل والبحث العلمي على أتم وجه .)١(‏ 


خرف 


الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


المصادر 


المصادر العربية 
.١‏ محمد زكي خضرء اللغة العربية والترجمة الآلية - المشاكل والحلول - 
المتمر الحادي عشر للتعريب - عمان / الأردن ١1-١7‏ تشرين الأول 

١‏ كام. 


والتعريب: -725421طام.20ع1335/51017711ن01 1 /ع. .هاه 17717/177.77//: خط 
الحاسوب-4-خدمة -الترجمة-والتعريب- 


؟. محمد بن محمد الغزالي أبوحامد - الممتصفى # علم الأصول- ١8‏ 

34 محمد الصرايرة - اللغة العربية والترجمة الآلية - محاضرة 4# مجمع 
اللغة العربية الأردني - الموسم الثقاي التاسع عشر ١١٠٠م‏ 

. أبوالحجاج محمد بشير - المعالجة الآلية للغة العربية جهود الحاضر 
وتحديات المستقبل - مجلة لغة العصر المصرية - ٠٠١94‏ 

5. عيدانء عدنان. طارق إبراهيم» الترجمة الآلية من اللغة الإنكليزية إلى 
اللغة العربية: تجربة شركة أي-تي-أي . لتقنية البرامج؛ مركز دراسات 
الوحدة العربية. ص 7/94 

٠.‏ آمنة فاطمة الزهراء - إشكالية حدود الترجمة الآلية: ترجمة نظام 
'سيستران" للمتلازمات اللفظية - رسالة الماجستير كلية الآداب و 


اللغات - قسم الترجمة - جامعة منتوري -قسنطينة- الجزائر 


خرف 


4 عبن الحميف ين العزلان: برتامج " عجيب" ذ الترجحية الآلية من اللغة 


الإنجليزية إلى اللغة العربية - رسالة ماجستير - الجامعة الإسلامية 


العالمية - ماليزيا - أغسطس ٠٠١0‏ 


المصادر الأجنبية 
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الحرفالعربي والتقنية 
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تقنيات التعرف الآلي على الكلام المنطوق وتطبيقاتها + 
القرآن الكريم: وافع وطموح 


د.يحيى محمد الحاج “ 


1155 [0قط1اء7 


أستاذ مساعد 4 جامعة الإمام محمد بن سعود الإسلامية 

حصل على درجة البكالوريوس 2# علوم الحاسب من جامعة القاضي عياض بالمغرب سنة 1١155‏ 
ثم نال درجة الماجستير والدكتوراه 4 المعالجة المتوازية والموزعة ضمن برامج أوربية مشتركة 4 
سنتي 1998 و2001. التحق بهيئة التدريس بقسم علوم الحاسب 4# كلية علوم الحاسب والمعلومات 
بجامعة الإمام بالمملكة العربية السعودية سنة 22٠١"‏ وتم تكليفه مؤخرا بالعمل ع مركز ا لحوسبة 
ذالمجالاتالشرعية والعربية الذي أنشئ حديثا بالجامعة والمجموعة البحثية حول الحوسبة 4 


المجالات العربية والشرعية //41615)01/. 
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الحرفالعربي والتقنية 
أبحاث في حوسبة العربية 


ملخص 


تمثل هذه الورقة بحثا استطلاعيا حول تقنيات التعرف الآلي على الكلام 
الملنطوق وواقع استخداماتها ف مجال القرآن الكريم. يتم # البداية تقديم 
عرض مفصل حول تقنيات التعرف الآلي على الكلام. مجالات تطبيقها بشكل 
عام ومفاهيمها الأساسية وأدواتها التقنية وطرق بناء تطبيقاتها. ومن ثم يتم 
استعراضن أهم الأعمال والجهود المبذولة # سبيل تطويع هذه التقنيات لخدمة 
القرآن الكريم كرصد للواقع الفعلي لمدى الإستفادة منها ب مجال تعلم وتعليم 
القرآن الكريم. وتختم الورقة بلفت أنظار المهتمين والمعنيين إلى ضرورة تكثيف 
الجهود وتضافرها للإستفادة من هذه التقنيات واستغلالها بشكل أمثل لتسهيل 
تعلم وتعليم القرآن الكريم؛ وتشير الورقة إلى نماذجين يمكن أن يكونا نواه لأنظمة 
فعلية وبيئات تفاعلية للتعلم الذاتي للقرآن الكريم. 
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مقدمهة 

يعتبر مجال التعرف الآلي على الأصوات المنطوقة أو ما يعرف أختصارا 
بالتعرف الآلي على الكلام من أهم وأقدم المجالات الحاسوبية التي حظيت بجهود 
بحثية معتبرة لكون تواصل الإنسان مع الآلة بلغته الطبيعية يمثل حلمًا طالما قد 
راوده [1]. ونظرًا لأهمية الكلام لدى الإنسان والأريحية 2# التعاطي معه؛ تزايدت 
بشكل ملحوظ الاستخد امات المتعددة لتقنيات التعرف الآلي على الكلام وظهرت 
تطبيقاته 4# مجالات شتىء منها التحكم عن بعد باستخدام الهاتف. ومساعدة 
المعوقين وذوي الاحتياجات الخاصة؛ والتعرف على المتحدث؛ والتعرف على اللغة, 
وإدخال النصوص. والأرشفة ثم البحث والاسترجاع .]١[‏ وقد برزت 4# السنوات 
الأخيرة توجهات جديدة تسعى إلى تطبيق هذه التقنيات # الأغراض التعليمية 
وبالذات# تعليم القراءة وتصحيح النطق. وبالرغم من حداثة هذه التوجهات 
البحثية؛ إلا إنها حظيت باهتمام كبير ومتسارع # لغات عدة؛ حيث أطلقت مشاريع 
عملاقة ع بلدان مختلفة: نذكر من بينها: مشروعي ' ليسن" [؟7-] و'كوليت" 
[غ-5] لتطوير برمجيات للتعرف على قراءة الأطفال وتحسين مستواهاء ومشروع 
"سبيمن" [7-7] لتطوير تقنيات للتعرف على الكلام المنطوق بشكل يتناسب مع 
التطبيقات التعليمية والطبية؛ ومشروع " القارئ الرفيق" [6] لمساعدة الأطفال 
والكبار على تعلم القراءة: ومشروع "القارئّ المساعد" [4] لمساعدة الطلاب على 
تحسين قدراتهم على القراءة الصحيحة وزيادة رصيدهم اللفوي ورفع مستوى 
فهمهم. 

أما على مستوى اللغة العربية فالجهود لا تزال محدودة. ولم تنتشر بعد 
الاستخدامات الفعلية لتقنيات التعرف الآلي على الكلام 4 تعليم اللفة العربية 
بشكل عام سواء للناطقين بها أولفير الناطقين بها على غرار ما يوجد # لغات 
أخرى. ولعل من أهم المجالات التطبيقية لتقنيات التعرف الآلي على الكلام 


احقي 


العربي المنطوق؛ تعليم النظام الصوتي للعربية الفصحى لمساعدة المسلمين (عربًا 
وعجما) على تلاوة القرآن بشكل صحيح سواء لحفظه أولأداء المناسك والشعائر 
الإسلامية. فالق رآن هو معجزة الإسلام الخالدة, أنزله الله ليتلى ويتدبر ويعمل 
به؛ ونبه الرسول صلى الله عليه وسلم على فضله وفضل تعلمه وتعليمه. حيث قال 
'"خيركم من تعلم القرآن وعلمه". وقد ظهر الحرص على حفظ القرآن الكريم 
وضبط تلاوته منذ نزوله على الرسول صلى الله عليه وسلم [ ١٠]؛‏ حيث تولا 
الصحابة رضوان الله عليهم مهمة حفظه وتحفيظه لجيل التابعين رضي الله عنهم, 
و انتقل متواترًا عبر الآجيال يتعلمه كل جيل مشافهة عن الجيل السابق. وقد ظهرت 
الدراسات المتعلقة بوصف أصوات العربية من حيث مخارجها وطرق إخراجها ب 
القرن الثاني الهجري على يد الخليل بن أحمد الفراهيدي وتلميذه سيبويه ١١1‏ ]؛ 
وتبع ذلك 4 القرن الثالث وما بعده تقعيد علم التجويد وتدوينه كعلم يهتم بتلاوة 
القرآن الكريم التلاوة الصحيحة [ ١7‏ ]. وقد أبدع سيبويه ومن تبعه من علماء اللغة 
4 وضع توصيفات دقيقة لأصوات العربية؛ وقد سبقوا غيرهم من الأمم 9 ذلك 
الوقت. ومع التطور التقني الذي شهده العالم ظهرت أجهزة ومعدات تقنية مكنت 
من معرفة الجهاز الصوتي لدى الإنسان وما يصدر عنه من موجات صوتية أثناء 
الكلام واستفادت منها لغات أخرى؛ ولم يتوقف الأمر عند هذا الحد بل برزت 
تقنيات حاسوبية تسعى إلى تحديد الصوت المنطوق والتأكد من سلامة نطقه؛ إلا 
إن هذه الوسائل التقنية لم تستغل بما يكفي لخدمة اللغة العربية بشكل عام والقرآن 
الكريم نشكل خاض: 


نهدف 2# هذا البحث إلى استعراضن تقنيات التعرف الآلي على الكلام 
لتقريبها من القارىٌ العربيء واستطلاع تطبيقاتها الحالية 4 القرآن الكريم؛ 
ونوجه الراغب 4# الاستزادة من المعلومات المتعلقة بالأجهزة الصوتية الحديثة 
وكيفية الإفادة منها ب ضبط مخارج الحروف وتعلم أحكام التجويد» نوجهه إلى 
بحث الدكتورين منصور الغامدي وعبد الله الأنصاري [؟1١]‏ المقدم # ندوة القرآن 


نيا 
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الكريم والتقنيات المعاصرة ' تقنية المعلومات" بمجمع الملك فهد لطباعة المصحف 
الشريف سنة 7٠١4‏ وكذلك بحث الدكتور غانم قدوري ١5[‏ ] وأحمد راغب .]١5[‏ 


تضم هذه الورقة - غير المقدمة والخاتمة - قسمين أساسيين: قسمًا نستعرض 
فيه بنوع من التفصيل الخلفية العلمية لتقنيات التعرف الآلي على الكلام وأدواته 
ومنهجية بناء تطبيقاته. ب حين نقدم # القسم الآخر أهم الأعمال التي اهتمت 
باستخدام تقنيات التعرف الآلي على الكلام 4# مجال القرآن الكريم كرصد للواقع 
الفعلي لاستغلال هذه التقنيات 4 خدمة القرآن. 


تقنيات التعرف الآلي على الكلام وأدواتها 

لقد أفضت الجهود البحثية 4 مجال التعرف الآلي على الكلام إلى نجاحات 
معتبرة وتجسدت بشكل كبير # العقود الثلاثة الأخيرة مع استخدام الطرق 
الإحصائية. وخصوصًا ما يعتمد منها على نماذج مركوف الخفية (-1135 1110065 
111 - واع2100 107 ) 16-171 ]. وسنستعرضن بتفصيلء 2 الأجزاء التالية, 
منهجية التعاطي مع تقنيات التعرف الآلي على الكلام المعتمد على هذا النوع من 
النمذجة. 
منهج بناء أنظمة التعرف الآلي على الكلام المعتمد على نماذج ماركوف الخفية 

يعتمد مبدأ استخدام نماذج مركوف الخفية (1111015) [19] 2# التعرف 
الآلي على الكلام؛: على تقسيم مفردات المعجم اللغوي المراد التعرف عليها إلى 
سلسلة من الوحدات الصوتية التي يتم تمثيل كل واحدة منها بنموذج صوتي 
([ع1100 عنأونامعث) مكون من مقاطع متوالية ( 0151815 56016206) : حيث 
يمثل كل مقطع ف النموذج قسما متجانسا ( او أجزاء متجانسة) من الإشارة 
الصوتية للصوت الممثل. 


"ه١‎ 


البنية النمطية ثتماذج ماركوف الخفية 4 تمثيل الأصوات المنطوقة 

تبين أغلب الدراسات الحديثة أنه يكفي استخدام نماذج مركوف خفية 
ذوات ثلاث مقاطع رئيسية (512165 810161188 11166 ) لتمثيل الأصوات 4# بنيتها 
الأساسية [١]‏ بحيث يمثل المقطعان الأول والأخير الأجزاء الانتقالية مع الوحدات 
الصوتية المجاورة 4 حين يمثل المقطع الأوسط الجزء الثابت والمستقر من الصوت 
نفسه؛ الشكل ١‏ يقدم تمثيلا تصوريًا لهذا النموذج. 
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الشكل :١‏ البنية الأساسية لتمثيل الوحدات الصوتية 

ويذهذا النموذجء يلاحظ أن الأجزاء المتشابهة ( أو المتجانسة) # بداية 
الإشارة الصوتية يتم تثبيتها على المقطع الأول 4# النموذج من خلال السهم 
الذي يخرج من المقطع ويعود إليه؛ ومع التقدم الزمني 2# الإشارة الصوتية وتغير 
خصائصها يتم الإنتقال إلى المقطع الثاني ( الأوسط) الذي بدوره تثبت عليه 
الأجزاء المتشابهة من الإشارة الممثلة للقسم الثابت والمستقر من الصوت عبر 
السهم الذي يخرج من المقطع ويعود إليه؛ بعد ذلك يتم الإنتقال إلى المقطع الثالث 
لتثبت عليه الأجزاء المتبقية من الإشارة الصوتية كذلك بواسطة السهم الذي يخرج 
من المقطع ويعود إليه. 

ولضبط عمليات مطابقة أجزاء الإشارة على مقاطع النموذج الثلاثة: يتم 
استخدام توزيعات احتمالية (1015]1111010025-2[(05 11177ط2*060) ترفق بالمقاطع 
لتمثيل الجزء الصوتي المصاحب. ( أنظر الشكل ؟). 
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)جم ()دصم ‏ (.)رمم 
الشكل !: البنية الأساسية لتمثيل الوحدات الصوتية مع التوزيعات الاحتمالية 
ومن الناحية الإجراءية. يضاف عادة إلى المقاطع الثلاثة (المذكورة آنفا) 
مقطعان استثتنائيان: واحد لتمثيل البداية والآخر لتمثيل النهاية: وذلك لربط 


| 


(.)و0م ‏ (.)جمهم ‏ (.) رطم 


الشكل ": البنية الإجملية لتمثيل الوحدات الصوتية 


وبناء على ما سبق فإن كل وحدة صوتية تمثل بنموذج مركوف خفي (111/1/1) 
(انظر الشكل ؛) يرمز له ب (11,4,8) - ك2 ؛ 

أ ببلع) -]1: تمثل توزيع القيم الاحتمالات الأولية لمقاطع النموذجء 
وهي دائمًا تساوي 0 عند المقطع الذي يمثل مدخل النموذج ومنطلقه ( 
6)15-1:و "ضهن" لبفية المقاظع ( الا ,2 0,7 ك7 ]+ أما لا« ترمة لعدد 


المقاطع 4 النموذج. 


4 06 ,») - كل : مصفوفة تضم قيمًا عددية تمثل احتمالات الانتقال 
الممكنة والمسموح بها بين مقاطع النموذجء وتحدد الهيكل أو البنية العامة للنموذج 
(/اع010م10' اع0ه21 ) . 

ت. بوي [(),58) - 8: مجموعة التوزيعات الاحتمالية المرفقة بمقاطع 
النموذج؛ حيث يرمز (.):5 للتوزيع الاحتمالي المرفق بالمقطع رقم : 2# النموذج. 
ومن خلال هذه التوزيعات يتم التعرف على الأجزاء الصوتية أثناء مطابقة الإشارة 
على مقاطع النموذج. 

نشير إلى أن التوزيعات الاحتمالية (.),28 عادة ما تكون من نوع (-681055© 
10 )؛ وقد تكون هذه التوزيعات منفردة بواقع واحد لكل مقطع ( -091155 512816 
هة1) بالنسبة للتطبيقات البسيطة:؛ أو خليط من التوزيعات ( 1110116 مةأودنته © 
95 - 2100615 ) # كل مقطع من مقاطع النموذج بالنسبة للتطبيقات الأكثر 
تعقيدا وذلك لزيادة القدرة على تمييز الخصائص الصوتية وضبطها بشكل أدق. 
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الشكل ؛ : بنية نمطية لنموذج ماركوف ذو ثلاث مقاطع أساسية 
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نسخ متعددة للوحدات الصوتية التي تتم نمذجتها لتتمكن التوزيعات الاحتمالية من 
تجميع الخصائص الصوتية المختلفة حسب النطق. ومن أجل ذلك لا بد من وجود 
قاعدة بيانات صوتية معدة سلمًا وفقًا لمواصفات ومميزات مناسبة. 


استخلاص الخصائص الصوتية من الإشارات لتدريب النماذج 

يبدأ التحضير لعملية التدريب؛ بمعالجة الإشارات الصوتية 4 قاعدة البيانات 
واستخراج الخصائصن منها (181136000 3]1016ه'1) ؛ وهوما يقتضي تقسيم 
الإشارة إلى مقاطع أو نوافذ زمنية قصيرة ( تتراوح عادة بين ٠١‏ و١٠‏ ملسكند ) يتم 
تمثيل كل منها بمتجهات تضم مجموعة من الخصائصى المميزة للمقطع. وهناك 
أنواع من الخصائص وطرق متعددة لاستخلاصهاء لكن أكثرها استخدامًا وشيوعًا 
مجال التعرف الآلي على الكلام هوما يعرف ب 11700 (لإعمعتتوعم1 1/161 
15 0605:31) ) . وللتحضير لاستخللاص هذه الخصائصصر.. لا بد من 
تحويل الإشارة من صيغتها العادية على شكل موجة إلى صيغة رقمية قابلة للتخزين 
والمعالجة (أنظر الشكل 0). وهنا ينبغي تحديد معدل العينات (118]6 8متامسة5) 
التي تقفيس عدد العينات المأخوذة 2# الثانية من الإشارة الصوتية إضافة إلى سعة 
تمثيلها (عدد البتات المستخدمة). وبما أن أغلب المعلومات 2# الكلام البشري 
موجودة 4 ترددات أقل من عشرة آلاف هرتزء فإن عشرين ألف عينة # الثانية 
كافية للتعرف على الكلام. فالكلام المسجل مثلا بواسطة الهاتف لا يحتاج إلا إلى 


أربعة آلاف هرتزء أى أن ثمانية آلاف عينة 2# الثانية كافية له. 


هه>" 
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١ 104‏ ص عام موك 
الشكل ه: إشارة صوتية مقسمة إلى عينات 


وتمر عملية استخلاصص الخصائص أو المؤثرات الصوتية بعدة مراحل كما 
يبينها الشكل 7. وتبدأ هذه المراحل بمعالجة الترددات العالية والمنخفضة لتكون ب 
مستوى متناسب ( 1228515عع1م) ( الشكل "). 


اعضاو د 
موع أعوطممحوو: ه82 ده 


ان نان 


10 عر ص رعامصوهه 


الشكل 5 : معالجة الترددات العالية والمنخفضة 


انا 
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يتم بعد ذلك تقسيم الإشارة إلى نوافذ زمنية صغيرة يتم تمثيل كل جزء منها 
بمتجه يتكون من مجموعة من القيم (عادة ما تكون 59 قيمة) تمثل الإثنا عشر 
عنصرًا الأولى من قيم ©1170 مضامًا إليها قيمة الطاقة للناغذة الزمنية لتمثيل 
الخصائصى الثابتة # المقطع الصوتي. ثم يضاف إلى ذلك قيمة الاشتقاق الأول 
والثاني لهذه العناصر لتمثيل الخصائص الديناميكية للمقطع. نشير هنا إلى أن 
عدد القيم # المتجه الذي يمثل المقطع الصوتي يمكن أن يكون أقل أو أكثر حسب 
أنواع التطبيقات: إلا إن القيم المذكورة هنا (59 قيمة) تعتبر متوسطة وهي كثيرة 
الاستخدام 4# تطبيقات التعرف الآلي على الكلام. 


00 سدم 0م906 
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الشكل /: خطوات استخلاص الخصاتص الصوتية (مستقاه من )]١[‏ 
تدريب النماذج الصوتية 
يتم التدريب بإدخال الخصائص الصوتية المستخرجة من الإشارات الصوتية 
إلى النماذج بشكل تكراري حتى تصل النماذج إلى القيم المثلى ( 5عنالا؟ [8دمتام0) . 
وهذا يعني أننا نقوم بتغيير قيم النموذج الصوتي التي رأيناها سابقاء أي مجموع 
قيم مصفوفة الانتقال بين مقاطع النموذج 55ص ,») وقيم التوزيعات الاحتمالية 
ب ((),6) المرفقة بمقاطع النموذج. يتم ذلك من خلال قاعدة بيانات التدريب 
التي يفترض أن تضم مجموعة من التكرارات ( نطق متكرر) لكل وحدة صوتية. 
ويمكن أن يتم التدريب بطريقتين؛ تدريب منفصل للوحدات الصوتية يعرف ب 
(عصنصنه 15 )نمل -له:15012) أو تدريب مدمج ( ع صتصنة1' ألم []-لء00ء طصط ) . 


/اه؟" 


غالنوع الأول يقتضي أن يكون كل ملف صوتي 4# قاعدة بيانات التدريب مقسمًا 
ومرمرًا بحيث تحدد البداية والنهاية الزمنية لكل وحدة صوتية فيه؛ ويتم تجميع 
الأجزاء الخاصة بكل وحدة صوتية من مختلف الملفات وتستخدم مع بعض لتدريب 
النموذج الذي يمثل تلك الوحدة الصوتية. وتعتمد جودة التدريب هنا على دقة 
تحديد الحدود الزمنية للآصوات. ونظرًا لما يتطلبه ذلك من وقت وجهد فإنه قد 
يكون من الصعب تجهيز فواعد بيانات صوتية كبيرة وفقا لهذه الطريقة وبالتالي 
يتم اللجوء إلى الطريقة الثانية التي تعرف بالتدريب المدمج. وفيها يتم الاكتفاء 
بتحديد قائمة الوحدات الصوتية لكل ملف صوتي ثم يترك للخوارزميات مهمة 
تقسيم الإشارة وتحديد الحدود الزمنية بشكل آلي من خلال مطابقة الإشارة 
الصوتية على تلك القائمة. ومع التقدم 4 مراحل التدريب تعمل الخوارزميات على 
ضبط تلك الحدود بشكل أفضل تدريجيًا حتى تصل إلى الأمثل. ويبقى وجود بيانات 
صوتية مقسمة زمنيًا على مستوى الوحدات أمرًا بالغ الأهمية 4# تسريع التدريب 
وضبطه بشكل أفضلء إضافة إلى أهميته 4 عدة أنواع من التطبيقات. 


وقبل الشروع ْ التدريب بأي من الطريقتين؛ يتم عادة تحديد قيم ابتدائية 
للنموذج تكون منطلقًا له؛ ويتم ذلك # الطريقة الأولى بتقسيم الإشارة بشكل 
متساو بين مقاطع النموذج ثم يتم استخدام إحدى صور الخوارزمية المعروفة باسم 
صاحبها 51261 [ 7١1-7١‏ ] لتحديد التسلسل الأمثل؛ وخوارزمية 1/1611 تعتمد 
على مبدء البرمجة الديناميكية؛ وقد ظهرت لأول مرة # منتصف الستينيات من 
القرن الماضي. أما كك الطريقة الثانية فيتم حساب متوسط وانحراف عام على 
كل بيانات التدريب ويتم استخدامهما كقيم ابتدائية لكل التوزيعات الاحتمالية ب 
النموذج (وهذا النمط يعرف ب" الإنطلاقة المنبسطة أو المستوية" ]5 ]513)؛ 
وبالنسبة لاحتمالات الانتقال بين مقاطع النموذج فيكفي أن توضع بشكل متساو 
البداية على أن تتغير أثناء التدريب. بعد تلك التحضيرات الأولية يتم التدريب 
الفعلي باستخدام خوارزمية تعرف هي الأخرى بأسماء أصحابها جاءغ1ه/لآ-صتناه8 
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[؟7]؛ وتعمل على حساب القيم المثلى لنماذج ماركوف الخفية بإدخال الخصائص 
الصوتية بشكل تكراري. 
اختبار وتجريب النماذج 

بعد الانتهاء من تدريب النماذج الصوتية؛ يتم عادة العمل على قياس مدى 
تجتاعديتيا نين خلال” عرض عيناةسوية عليها ومشاولنة تحزيد ما بطق ف قزاسن 
مدى صحته. ويحتاج هذا الأمرإلى وضع نموذج لغوي (100061 0 يحدد 
التتابعات المسموح بها حسب نوع التطبيق؛ فقد يكون التطبيق عبارة عن كلمات أو 
وحدات منفردة يتم نطق كل منها على حدة والتعرف عليه بشكل منفصل ( ويعرف 
هذا النوع ب 05 تمع معع] 15012160-1770105 أي التعرف على كلمات منفردة) »2 
ويكون النموذج اللغوي 4 هذه الحالة بسيطا؛ وقد يكون التطبيق عبارة عن جمل 
تضم سلسلة من الكلمات وفقا لقواعد يتم تحديدها وتشكل طبيعة النموذج اللغوي 
(ويعرف هذا النوع ب 16052مع معع 1 0-17170105عاعع ممه 0 أي التعرف على كلمات 
متصلة أو مترابطة)؛ وقد يكون التطبيق يسعى إلى التعرف الآلي على الكلام ب 
صيغته الطبيعية (وهوما يعرف ب 162082011100 اععءم5 12110115كم 00 أي التعرف 
على الكلام المتواصل) ؛ ويبنى النموذج اللغوي 2# هذه الحالة وفقًا للقواعد اللغوية 
التي تحكم بنية الجملة. ويستخدم الجانب النصي 4 ذخيرة التدريب لحساب 
احتمالات التتابعات الممكنة وفمًا لنماذج إحصائية تعرف ب 01310-/7". ويلعب 
النموذج اللغوي دورًا مهما ِ تحسين نسبة التعرف لأنه يساعد على تحديد الاختيار 
الأمثل من بين الاحتمالات الممكنة بناء على التسلسلات التي تدرب عليها. 

ضفي مرحلة التعرف يتم أولا بناء فضاء للبحث ( م6182 ه563 ) على شكل 
شبكة تربط بين الوحدات الصوتية وفما لما يحدده النموذج اللغوي؛ فإذا كان 
النموذج اللغوي معرمًا على مستوى الجملء فإن الشبكة تبنى على ثلاثة مستويات, 
الأول يمشل كيفية توالي الكلمات # الجملة؛ أما الثاني ففيه يتم تعويض كل كلمة 


الحا 


بحالاتها النطقية وفْقًا لما يحدده القاموس النطقي ( 161602 1202 صنام20) ؛ 
و المستوى الثالث يتم تعويض كل وحدة #ش القاموس النطقي بالنموذج الصوتي 
الذي يمثلها (انظر الشكل 8). أما إن كان النموذج اللغوي معرمًا على مستوى 
الوحدات اللغوية الأصغر من الكلمة؛ فيتم تعويض كل وحدة بنموذ جها الصوتي 
مياشرة للحصول على الشبكة. 
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الشكل 8: توئيد فضاء أو شبكة البحث 4 مرحلة التعرف 
يتم البحث 4 هذه الشبكة - أيضًا- باستخدام خوارزمية البرمجة الديناميكية 
116:1 التي تعمل على إيجاد أفضل مسار 4 الشبكة؛ وهو عبارة عن سلسلة من 
قياس أداء أنظمة التعرف 
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611ة/ مع ماتم نطقه أصلاء حيث ينبغي أن تكون هناك عينة مجهزة سلفًا 
وموضوعة 4 صيغة ممائلة لما يخرجه نظام التعرف؛ وتعرف هذه العينة بعينة 
الاختبارء وهي جزء من قاعدة البيانات الصوتية التي أشرنا إلى ضرورة وجودها 
خلال الحديث عن التدريب. 


وكوحدة لقيامس الأداء؛ يتم حساب عدد الكلمات أو الوحدات الصوتية التي 
تم التعرف عليها بشكل صحيح ( دون النظر إلى مكانها وترتيبها حسب المدخلات) 
وتقسم على عدد الكلمات المدخلة؛ ويعرف هذا المقيامس ب "هتمع م16 5200 
6 أي نسبة التعرف على الكلمات. ويوجد مقياس أكثر صرامة لقياس دقة 
نظام التعرف ( يسمى "لزع ةشساءعة ممتاتمع ههه 2" أي دقة التعرف). حيث تحتسب 
فيه نسب الاستبدال والإضافة والحذف, بمعنا أن الكلمات التي يتم التعرف عليها 
بشكل صحيح لا تحسب إلا إذا كانت 2# مكانها المناسب حسب ترتيب المدخلات. 


أدوات بناء أنظمة التعرف الآلي على الكلام 
يعتبر بناء أنظمة التعرف الآلي على الكلام بشكل عام أمرًا صعبًا لكونه 
يحتاج إلى جهود كبيرة وتخصصات مختلفة ( صوتية ولغوية وحاسوبية وغيرها) . 
ولتسهيل وتسريع بناء تلك الأنظمة تم التوجه 4# الأوساط الأكاديمية إلى إنشاء 
بيئات تطويرية توفر جملة من الآدوات الأساسية يمكن للمطور الاستعانة بها بناء 
تطبيقاته المختلفة. ولعل من أشهر تلك البيئات وأكثرها استخد اما نظام :طتنام5 
[؟١؟]‏ وحزمة أدوات 1111 (1001104 1ع7100 7مع1تة1/1 صمع11:00) [ :؟ ] اللذان 
يمكنان من بناء أنظمة التعرف الآلي على الكلام بمختلف أنواعهاء وذلك من حيث: 
.١‏ الحجم, أي عدد الوحدات التي يمكن للنظام التعرف عليها "-ناطقء 1/0 
13" ؛ ويمكن أن يكون هذا العدد صغيرا أو متوسطا أو كبيراء 
”. طريقة النطقء أي كيفية التعاطي مع المدخلات 2# النظام؛ هل يتعامل النظام 
مع كلمات أو وحدات منفصلة:؛ أم يتعامل مع كلمات متصلة تشكل جملا قصيرة 
مبنية وفقا لقواعد محددة؛ أم يتعاطى مع الكلام الطبيعي 2 مجمله: 
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". عدد المستخدمين؛ أي عدد المتحدثين الذين يمكن للنظام التعرف عليهم. 
فقد يكون للنظام مستخدما واحدا تدرب على صوته ولا يتعرف إلا عليه؛ 
ويدعى النظام 4 هذه الحالة "أصعلمومعء ل 0311 وقد يكون النظام 
قادرا على التعرف على عدد معين من المستخدمين تدرب على أصواتهم 
ويدعى # هذه الحالة "مع علةهمه- نا ]ناص ؛ وقد يكون النظام مستقلا 
عن المتحدث. بمعنى أنه قادر على التعرف على صوت أي متحدث لكونه 
تدرب على عد كبير من المتحدثين: ويدعى 2 هذه الحالة ' -مز أععلوءم5 


م مهمع" : 


كم تطوير نظام عتمتطمم 2# جامعة كارنيجي ميلون بالولايات المتحدة 
الأمريكية. وهويستخدم نماذج ماركوف الخفية 4 نمذجة الأصوات ويضم قسمين 


طرق مختلفة # التعرف آخرها 15::4طم5 [5؟] الذي تم تطويره باستخدام لغة 
الجافا وهو يحتوي على ثلاثة أجزاء أساسية أساسية هي: 


١‏ الواجهة (لمطخصمء] ) : تقوم باستقيال الإشارة وتحويلها إلى مجموعة 
من الخصائص الرقمية وفقًا لآليات استخلاص الخصائص التي 
معلومات القاموس اللفظي الذي يضم الحالات النطقية الممكنة والنماذج 
الصوتية لتكوين مجال وشبكة البحث. 

". المتعرف (10600068): يقوم باستخدام الخصائصب الرقمية ومجال 
البحث الذي تم إنشاؤه لأداء عملية التعرف الفعلية. 


أما حزمة أدوات 1111 التي تعتبر الأشهر والأكثر انتشاراء فقد تم تطويرها 
4 جامعة كامبريدج ببريطانيا. وفيها يتم تمثيل كل وحدة صوتية باستخدام نموذج 
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ماركوف خفي واحدء وكل كلمة كسلسلة من النماذج. ويتكون 1111 من أربعة أجزاء 


رئيسية هي 


.١‏ أدوات تجهيز البيانات: وتقوم باستقبال الإشارة الصوتية ومعالجتها 
ثم استخلاص الخصائصى الرقمية منها وفقًا لأحدى الصيغ المناسبة 
( 281500 1.20؛ إلخ.)؛ كما تقوم هذه الأدوات بتجهيز البيانات للمرحلة 
المقبلة. 

؟. أدوات التدريب: وتمكن من تعريف الهيكل العام للنماذج الصوتية 
وتحديد قيمها الابتدائية ثم تدريبها بالآلية والخوارزميات التي ذ كرناها 
ل4# الجزء السابق. 

؟. أدوات التعرف: وتمكن من استخدام النماذج الصوتية والنموذج اللغوي 
والقامومس النطقي مع خوارزمية 17116101 لمحاولة التعرف على ما تم 

4. أدوات التحليل: تستخدم لتحليل النتائج وتقييم الآداء. 

ولعل هذين النظامين يعتبران من أنضج الوسائل المعتمدة على الطرق الإحصائية 

والمستخدمة اليوم كك بناء أنظمة التعرف الآلي على الكلام. ولا توجد حسب علمنا 
دراسات مقارنة تبين أهمية واحد على الآخر حسب نوع التطبيق المراد عمله. 


واقع استخدام تقنيات التعرف الآلي على الكلام ب خدمة القرآن الكريم 

إن الأعمال البحثية # مجال التعرف الآلي على الكلام العربي بشكل عام لا 
تزال محدودة إذا ما قورنت بما تم 2# اللغات الأخرى كالإنكليزية مثلاء على الرغم 
من أن اللغة العربية تصنف من حيث عدد المتحدثين بها # المرتبة الثانية عاميًا 
بأكثر من 77: مليون متحدث # حين تأتي اللغة الإنكليزية # المرتبة الرابعة وذلك 
وفقالما أوردته موسوعة أنكرتا الشهيرة وما جاء 4 هذه الإحصائية [1؟]. ولعل 
من بين الأسباب التي قد تكون وراء ذلك النقص غياب البنى التحتية اللازمة لبناء 
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أنظمة التعرف الآلي على الكلام؛ سواء ما تعلق منها بالصوتيات العربية وقواعد 
بياناتها [77] أو تقنيات معالجتها كلغة طبيعية [58] أو غير ذلك. ومع هذا فقد 
بدأت تلوح بوادر لتزايد الاهتمام # السنوات الأخيرة؛ حيث انطلقت أبحاث 


متعددة: نذكر من بينها [/1؟4-5؟]. 


أما الأعمال التي اهتمت بتوظيف تقنيات التعرف الآلي على الكلام لخدمة 
القرآن الكريم فهي قليلة على حد علمنا؛ وبعضها عبارة عن محاولات متواضعة لا 
تعكس أهمية القرآن الكريم 2# حياة المسلمين. 


ومن بين هذه الأعمال التي اهتمت بتوظيف تقنيات التعرف الآلي على الكلام 
لخدمة القرآن الكريم» ما قام به مرتجى وزملاؤه ْ جامعة عمان: حيث سعوا 
لبناء نظام للتعرف الآلي على التلاوة القرآنية مرتبط بالمتحدث (-7-1(6ع81م5 
4 واستخدموا 4 ذلك نماذج ماركوف الخفية لتمثيل الوحدات الصوتية 
حسب السياق (1720061 111/131 عدمطم- تنا) [5؟]. وقد استخدموا عينة من 50؟ آية 
للتدريب والاختبار. ووصلت نسبة التعرف عندهم إلى 7١‏ حيث اعتبروها مناسبة 
ومرضية جد إذا ما قورنت مع قلة الآيات المستخدمة. وقد قام نفمس الفريق» 
لاحقاء بتطوير النظام ليصبح مستقلا عن المتحدث (060650656ه1آ<ععلهءم5) 
واستخدموا تقنية 111116 (55102ع682] تتدعمارآ 000طتاعكلنآ تمنامسترجدك3 ) 
لملاءمة النموذج [77]. وقد أخذوا الجزء الأخير من القرآن الكريم (جزء "عم" ) 
بتلاوات خمسة قراء للتدريب والاختبار ولكنهم لم يحددوا ما الحجم المستخدم 4 
التدريب والاختبار كل على حدة. كما أنهم لم يبينوا ما إذا كان الاختبار وقع على 
جزء مما استخدم 4# التدريب أم لا؟ ولم يذكروا كذلك ما إذا كانوا قد استخدموا 
نموذجًا لغويًا أم لا5 مع أن لكل ذلك علاقة وطيدة بأداء النظام. وقد وصلوا إلى 
نتائج تتراوح بين 7/8 و0/ حسب القارئء أي بمعدل حوالي /ا7/. وأوردوا ب 
بحثهم أن هذه النتائج تم الحصول عليها باستخدام نماذج ماركوف مكونة من ؟١‏ 
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مقطع لكل واحد على حدة: ونظرًا لذلك فقد ذكروا أن مرحلة التعرف 4# نظامهم 
تعتبر بطيئة. واستخدموا 4 بناء تلك الأنظمة أدوات >1111. 

وقد أهتم طبال وزملاؤه ْ الجامعة اللبنانية باكتشاف الآيات القرآنية ب 
الملفات الصوتية بغية تحديدها واستخلاصها [7؟]. وقد استخدموا نظام ع:صنطم5 
4 ذلك: ولكنهم اقتصروا فقط على سورة الإخلاص بمقرئين متعددين ( عشرين 
قاركا) ولم يبينوا ما إذا كان الاختبارتم على نفس التلاوات التي استخدمت ل 
التدريب. وعلى اعتبار أنهم يسعون فق ط إلى تمييز الآيات القرآنية عن غيرهاء 
فقد استخدموا نموذجا لغويًا للآيات الموجودة # سورة الإخلاص. ويذكرون أنهم 
قاموا بتجارب على نوعين من التلاوات؛ تلاوات مرتلة وتلاوات مجودة؛ وحصلوا 2 
المعدل على نسبة #457 النوع الأول و٠5‏ 2# النوع الثاني مع العلم أنهم استخدموا 
٠٠‏ قارئا ك# كل نوع. وحسبما أوردوا فإن التلاوات المرتلة أسرع من تلك المجودة 
وأقل تركيزا منها على استيفاء المدد الزمنية للأصوات القرآنية. 

ومن بين الأعمال الهامة ك المجال. مشروع "1-041" [81؟] الذي أطلقتنه 
الحكومة الماليزية سنة 4١٠٠م‏ ضمن خصطتها لتطوير الرأس المال البشري '-12 
لهاتصة مقصن11 عمتعممم" ورصدت له مبالغ مالية كبيرة؛ وهو يسعى إلى بناء 
أنظمة حاسوبية لتعليم تلاوة القرآن الكريم واللغة العربية والواجبات الدينية ب 
المدارمس الابتدائية إضافة إلى تعلم الخط الملاوي العربي. هذا المشروع يتكون 
من سبع وحدات وأقسام تعليمية (210010165 16361128 ) بنيت بشكل تدريجي 
حتى نهاية الفترة الرئيسية للمشروع سنة ١٠١5م؛‏ ومن بين هذه الوحدات» 
أقسام لتحفيظ القرآن الكريم وتعليم قواعده التجويدية إضافة إلى قسم لتعليم 
اللفة العربية. والأقسام التي تعنى بالقرآن الكريم # هذا المشروع بدأت بتقنيات 
الملتيميديا التفاعلية ]:٠-79[‏ ثم تدرجت لتصل 2# المراحل الأخيرة إلى إدخال 
تقنيات التعرف الآلي على الكلام حسب ما ذكر [١4]؛‏ ولم يتسنّ لنا إيجاد تفاصيل 


”25ظ 


حول آليات التعرف الآلي المستخدمة ولا مستوى الدقة الذي وصلت له. وقد قام 
ظريف وزملاؤه مؤخرًا بدراسة لتقييم فاعلية أقسام تعليم القرآن ‏ هذا المشروع 
وقياس أثرها على الطلاب [57]؛ وأظهرت الدراسة مستوى عاليا 4 ضبط التلاوة 
القرآنية (النطق وأحكام التجويد) وانعكاسات ذلك على تحسن مستويات الطلاب 
لك تعلم اللغة العربية. 

ومن الأعمال البارزة ب مجال توظيف تقنيات التعرف الآلي على الكلام 
لخدمة القرآن الكريم. مشروع حفصن [5؛] الذي أنتجته الشركة الهندسية 
لتطوير نظم الحاسبات المصرية 1101 .4# صورة برنامج كمبيوتر تفاعلي يسعى 
للتمكين من التعلّم الذاتي لأحكام تجويد القرآن الكريم. تقوم الفكرة على محاولة 
التوتامج مشاكاة امعرقة ف الككافيي سق خلال إكساءع التعلم مكالا لحلاوة كفو جية 
كو لوقه الويساعزها كوو بشحه قوم البواا بتع رتيل جا انطع لسك 
وتوليد تقرير صوتي وكتابي بأخطاء المتعلم ويطلب منه التركيز على تصحيح نطقه 
للمواضيع التي أخطأ فيها ثم إعادة التسميع؛ وهكذا إلى أن يجيز البرنامج قراءة 
المتعلم. وقد نشرت أوراق بحثية تبين الجوانب التقنية لآلية التعرف الآلي المتبعة بخ 
تحديد الأخطاء النطقية خلال تلاوة المتعلم للأمثلة المضمنة 4# البرنامج والتي 
تدور حول مواطن وجود أحكام تجويدية [57-44]. وقد ذكر أن تقييم البرنامج 
يتم من خلال قاعدة بيانات تضم تلاوات للامثلة التي يتعامل معها البرنامج لقراء 
مجازين؛ حيث قرئ كل مثال عدة مرات:؛ بعضها بشكل صحيح وبعضها أدخلت 
فيه أخطاء نطقية شائعة. ثم طلب من خبراء لغويين تحليل مختلف النطق المسجل 
وكتابته صوتيا مع توصيف للأخطاء ليستخدم كل ذلك 2# آليات التعرف الآلي 
والمقارنات أثناء استخدام البرنامج. وتشير النتائج إلى أن البرناج يعطي القرار 
الصحيح حول القراءة (صحة القراءة أو رسالة تشخيص اللأخطاء ) بنسبة 
4/: وهي نسبة جيدة. وتذكر الشركة أنها تعمل على تحسين أداء البرنامج بشكل 
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مسكمرء وتسعى لتطويره مستقبلا ليتجاوز حدود التعامل مع حالات نطقية محددة 
ويصبح قادرًا على تصحيح التلاوة والاستخدام 4# التحفيظ الآلي بشكل عام. 


ومن ضمن الأعمال البارزة ع المجال أيضاء مشروع التعليم الآلي للقرآن 
الكريم [57] الذي مولته مدينة الملك عبدالعزيز للعلوم والتقنية؛ والذي سعى إلى 
وضع نموذج لبيئة حاسوبية للتحفيظ الآلي للقرآن الكريم تستخدم فيها تقنيات 
التعرف الآلي على الكلام لمساعدة القارئّ على تصحيح نطقه وضبط حفظه. 
وقد ركز المشروع على إعداد بنى تحتية قوية تساعد على الوصول إلى مصحح آلي 
دقيق يمكن استخدامه 4# نظام حلقات افتراضية لتعليم القرآن الكريم. ومن أهم 
البنى التحتية التي ركز عليها المشروع؛ بناء قاعدة بيانات صوتية لتلاوات قرآنية 
وتجهيزها بشكل مناسب لبناء أنظمة للتعرف الآلي على الأصوات القرآنية بمختلف 
صورها وكذلك أصوات اللغة العربية الفصحى حيث هي لغة القرآن. وقد استخدم 
جزء "عم" كعينة وتم تسجيله بتلاوات عشرة قراء تم اختيارهم من طلاب الجمعية 
الخيرية لتحفيظ القرآن الكريم بالرياض؛ وتمت التلاوات والتسجيلات تحت 
إشراف مختص 4 القرآن وعلومه. هذه التلاوات تم تقطيعها وترميزها صوتيا على 
ثلاثة مستويات هي الكلمة والأصوات الأصول (الفونيمات) ثم الآصوات الفروع 
( الآلوفونات) التي تمثل مختلف الحالات النطقية مثل الغنة والقلقلة والتفخيم 
والترقيق ودرجات المدود وغير ذلك من الظواهر الصوتية # التلاوة القلا آنية 
[4:-45]؛ والشكل 4 يوضح مستويات التقطيع وآلية الترميز المستخدمة. 


/؟ 


الشكل 9: مستويات التقطيع ف قاعدة البيانات الصوتية للقرآن الكريم 


بالاعتماد على هذه القاعدة الصوتية تم بناء نموذ جين أوليين للتعرف الآلي 
على الأصوات, واحد على مستوى الأصوات الأصول [50] والآخر على مستوى 
الأصوات الفروع [01]. وقد استخدمت نماذج ماركوف الخفية مع خليط من 
التوزيعات الاحتمالية؛ وتم قياس الآداء من خلال سلسلة من التجارب: تم # كل 
واحدة منها الاختبار على عينة من قارئ محدد لم تستخدم 3# التدريب الذي يتم 
على بقية تلاوة هذا القارئ وتلاوات القراء الآخرين: ثم يحسب معدل نسب التعرف 
الإجمالية لكل القراء. وقد وصلت النتائج إلى 57 بالنسبة للآصوات الأصول و/// 
بالنسبة للأصوات الفروع؛ وهي نسب جيدة وتوحي بإمكانية الوصول إلى مستويات 
عالية من الدقة 4# التعرف على مختلف الأصوات القرآنية أثناء التلاوة. 


و4 المشروع تم وضع تصور لنظام حلقات إفتراضية [55-55] تحاكي نظام 
التحفيظ الاعتيادي ( الأشكال ».)١١9٠١‏ وتسهل التواصل بين المعلمين والمتعلمين 
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المعتمد على تقنيات التعرف الآلي على الكلام مع نظام الحلقات الافتراضية 
خلال آليات التواصل. 


شكل :١١‏ معمارية نظام الحلقات الافتراضية (مستقاه من [57]) 


1 


وقد اهتم المشروع 2# جانب آخر من جوانبه بدراسة المتشابه اللفظي وتحديد 
مواطنه لأهمية ذلك 2# التحفيظ. وقد استخدمت تقنيات # مجال تحليل النصوص 
لقيامس درجة التشابه بين الكلمات ووضع معايير ومقاييمس لترتيب الآيات حسب 
مستويات التشابه [04]. ووضعت آلية لربط التشابه مع التحفيظ لمساعدة الدارس 
4 إتقان حفظه. كما أضيف 2# نظام التحفيظ مكتبة تضم أهم كتب علوم القرآن 
الأخرى ( الإعراب؛ التفسيرء أسباب النزول) وتم ربطها مع النص القرآني لتسهيل 
الوصول إليها. 

وبشكل عام فإن مشروع التعليم الآلي للقرآن الكريم وضع أسسًا قوية لبناء 
بيئة حاسوبية متكاملة للتحفيظ الآلي للقرآن الكريم.: لكنه يحتاج إلى جهة تتبناه 
وتحوله من نموذج بحشي إلى منتج فعلي يخدم الراغبين ‏ حفظ القرآن الكريم 
وتعلم علومه. 
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الخاتمة 


لقد قدمنا هذا البحث بسطا لأشهر تقنيات التعرف الآلي على الكلام 
ومنهجية بناء نظمه وأدواته؛ ثم استعرضنا بنوع من التفصيل واقع استخدام 
هذه التقنيات 4# الوقت الحالي لخدمة القرآن الكريم. ولعل القارئىّ والمتتبع لهذه 
الأعمال يشعر بأنها لا تزال محدودة وتحتاج إلى تراكم 4 الخبرة وتضافر ب 
الجهود لنصل إلى مستوى من التحكم 4# تلك التقنيات يمكن من تطويعها بما 


يتماشى مع خصوصية القرآن الكريم وقدسيته. 


ومن أهم وأنضج ما استعرضناه من أعمال مشروع حفصص ومشروع التعليم 
الآلي للقرآن الكريم؛ فالأول منتج تجاري والثاني نموذج بحشي. فمشروع حفص 
يركز على تعليم وتطبيق أحكام التجويد من خلال التعامل مع مقاطع محددة من 
القرآن الكريم؛ حيث يسمع المتعلم تلاوتها بقراءة نموذجية ثم يطلب منه محاولة 
محاكاتها ومن ثم يقوم بتوجيهه بناء على مستوى نطقه؛ وهو عمل جاد ومفيد. أما 
مشروع التعليم الآلي للقرآن الكريم فله أهداف أوسع وأشمل: تضم # صلبها بيئّة 
حاسوبية للتحفيظ الآلي للقرآن الكريم مشتملة على مختلف علومه. وقد وضع فيه 
نموذج لحلقات افتراضية تحاكي نظام حلقات التحفيظ الاعتيادية وتسهل التواصل 
مع المقرئين. وتم وضع تصور لربطه مع نظام التصحيح الآلي للنطق والحفظ ليكون 
ذلك عونا للدارس من جهة؛ ومساعدا للمقرئ من جهة أخرى ي تسريع التعاطي 
مع المتعلمين. والنظام يعتمد ش رؤيته على عدم إلزام المتعلمين والمعلمين بالتزامن 
أثناء العمل مع إتاحة خيار للتواصل المباشر سواء لتقديم توجيهات وتعليقات عند 
الحاجة أو لإجراء اختبارات لمنح إجازات أو كذلك للقيام بمسابقات قرآنية. 


/ا؟ 
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-115 211101عمعع1 طاععءم5 عأطوتى .(2006) .2111 .خا :2725521 .81 
طاءع!' طعععم5 04 012281[ 2200021ضعام] .عصتوي 522811112 عصذ 
1381-6 .مم :(9)3-4 برع 1010 


1ق لهنأناو0110) لخ مختاكظ .(2007) .وكتتك .0.1 :82126 .ذل 
-مكث 05 0111231[ هع أتعلطة .ممتدعتاممظة امتاتصمعومءع8 طاعععم5 
23-2 .مم :(4)1 وععمعكق5 1160م 


.(2005) تططوئع5 .5 لطاعتتفطد للح بطهللهلطق .11 310101282 .8 
-151' 5128لآ امغختصمومءع] أدمعلرعمء دآ عكلوعءعم5 82560 علطهة1 0 
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كلوعم2007(.5) .مطونء5 .5 .اع تتمطاد .لح طه[لهل0طق .81 810101252 .8 .36 
-عكل1آ متناسهجة ]8 ده لع825 تناع تمع معع]1 عنصه 00 أخمعلرءمع0م[1-مرء 
376-22 .مم :20 .17701 :2114511 .2ضزأووعموع] تدعطاا 00مطتا 


-122 220 5أوتولمصكة .(2007) .قلدهك]8 .8 بتامله7-لة .117 لقططه1 .11 .37 
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-2اأعع] علصه 0131 عطا عصتطعوع'1' .2012) .182157201 .0 :8/1552 .1 .40 
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.8 155116 :3 عمتتنآه7 ماع تتوع5 


7156 0131 .2008 .21 غهء ممصتطوءط] .[.لظ علوههدظ8] .2 .41 
-ع1 لل بع منتطتدع.[ 41 0-ز مذ ]امم متاك 101 11001116 م تمع معع1] 
.207-66 .مم :(8)8 :5للكن[]1 .لاع171 


01111 عطتووءوكك .(2014) .تتدكله8 .8 .20 لمتقطه]/! .11 كتتدتة .1/1 .42 
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-223ن 97 لعطكتاطنا2 :6 .810 :1701.7 ادناه[ 51015 امتاوعن 1801 
220 ععمعن5 01 تتعامع 0 ممتل 


لأعط.دد كه طر / :اخط .43 


عط .0 تتمطود .لل .متوتتخطنج18 .71 .لتسمتوط .5 عتاملطط .5 .44 
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-لعع210 .1165ل أقطاءع '1' 02 المع معع] طععءم5 ع نزولا عاد( ع متطتتهء.]1 
54ل ث2 بطوتتاطئا]1 .2006-1512 11711815281011 عط 1ه دعصا 


2007 .تتوكط185 .11 مالتلقط] .8 .على نتاملطكق .151 .5 بتتصتودك .خم 
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.512 - 2007 11111152818011 عط 4ه ووصنلعءعءء2:0 .وصتصعمع1 
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-220 0ع0 نم اعأ ا مططاهن) لل .(2014) .توتتطمد18 .11 عتاملطق .11 .5 
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.01 :10013آ عناء طمع 81057 10-13 :2014 
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/اغ. يحيى الحاجء عماد الصغيرء منصرر الغامدي؛ محمد الكتهل» عبد الله 
الأنصاري. ٠١١7(‏ م). التعليم الآلي للقرآن الكريم. تقرير فني نهائي: مدينة 


الملك عبد العزيز للعلوم والتقنية؛ الرياضء السعودية. 


-5975 203121131 لق . (2007) .ل طاممكلاك .81 :(8120 .0.8.ل ال سمطاكلة .1/1 
118115 01 تعصتلءءء210 .اععءم5 عأطدمة عطقتو مهتا 220 ختاعطرعء؟5 م1 مرعا 
.1-4244-1236-6 15811 .233-236 .مم .1خ نآ 01121[ .2007 10520 


6. يحيى الحاجء منصور الغامدي؛ محمد الكتهل, عبدالله الأنصاري. (9: 
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06 


م). ذخيرة صوتية لجزء من القرآن الكريم. ندوة القرآن الكريم والتقنيات 
المعاصرة تقنية المعلومات" . المدينة المنورة -المملكة العربية السعودية؛ -١١‏ 


1١6‏ أكتوبر. 


-126ع2102 .(2013) .لمطسعكلاق .811 .للسصقمطولك .11 .زلقطاظ ./0.8.آ 
أخمععع1 .01102 8017 عط عستلمع8] أدزومة مغ تعمتمومءع8 82560 
عع نااع خم[ صا وععص هكلم دع هم امكمص] أمعى لاعخم[ صا وععسه حلم 

.011851 .141-152 مم :235 .1701 .اتام مهن لله قلع و5 
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اعد20ممة .(2013) .لمطسصعكللق .81 .للسمطعاخ .81 .للمطاظ .2.0.84" .51 
عأطهتك لمعذذكد[ن) عطا 04 كلصتاهد عنصمطمه1[لى عستجعتمعومءع8] +10 
8123131 01 ععتاع 2:2 له وامعط1' .دهم مك1 0102 جره 8250 
.7016 .501626 2111م طذ 810165 ع 1تاععا م مانام صامن 
.50111151 .57-67 مم[ 


101 57756612 ع تلتطتدع.آ-1 نه غخدع8-11212 .(2010) .(0ل2طاظ .0.81.لا .52 

-1:0112 01 0111221[ عصتلم0 طم ةلمن" .مهعن9 جام عط عصنطعةء ]' 

15511) :54-61 :مم .1 80 .1701.9 :100[18:15) ع0 1مصطع1' لهصمة 
.2146-7242 


تومي الحايفاف العروية الى 9 الف 1 


44. عماد الصفيرء عبد اللّه الأنصاريء احمد خرصيء يوسف العوهلي. 
(9١٠٠م).‏ محرك بحشث المتشابه اللفظي 4 القرآن. ندوة القرآن الكريم 
والتقنيات المعاصرة تقنية المعلومات" . المدينة المنورة - المملكة العربية 
السعودية, ١0-١7‏ أكتوبر. 


الف 


الخاتمة 


استقصى هذا الكتاب ما وصلت إليه العديد من المجالات التي يتدخل فيها 
الحاسوب اليوم لخدمة اللغة العربية؛ وإن كانت ثمة نتيجة مستخلصة 2# نهايته, 
فهي أن الحاجة لتطويرها -جميعا- ما زالت كبيرة. فللوهلة الأولى -مثلا- قد 
يبدو أن نظام تمثيل الكتابة العربية الحالي خال من المشكلات. ولكن ما أن نقراً 
البحث الأول من هذا الكتاب حتى نرى ما أخفاه الاعتياد من مشكلات. وي البحث 
الثاني؛ تتجلى غزارة الأبواب المفتحة للتطوير. غفي أسامس محدود -وهو أساس 
المدونات اللغوية- ومن مكان محدود أيضا وهو جامعة ليدز- تطل علينا بحوث 
متضافرة تتسع مجالاتها بتعددها وتطورها. أما البحث الثالث فقد استقصى واقع 
قواعد البيانات الرقمية للوثائق الترائية العربية والإسلامية وبين أن الدراسات 
هذا المضمار -حاليا- تنشط على قدم وساق ولكن أكثرها لا يفي بحاجات 
الحوسبة بعد كما أنه لا يتوفر للباحث العربي بلغته. 


واستقصى البحث الرابع من الكتاب كشيرا من الأدوات التي تؤدي وظائكف 
تشترك 2# احتياجها العديد من التطبيقات اللغوية العربية؛ وذكر مراجع نظرية 
وعملية لهاء كما أشار إلى بعض جوانب النقص فيها. ثم أخلص البحث الخامس 
لجانب التشكيل الآلي للنصوص العربية؛ وللقواعد التعلمية الإحصائية منه تحديدا 
ونسب صحة أدائها من خطئها. 


ثم ناقش البحثان الأخيران تطبيقين يمثلان أبرز الغايات للباحثين ‏ حوسبة 
اللغة العربية؛ وهما: تطبيق الترجمة الآلية من العربية وإليها وتطبيق التعرف على 
قراءة القرآن الكريم منطوقا. وقد خلص الباحثان إلى مسيمس الحاجة إلى بنى 
تحتية ومزيد أدوات وإلى تضافر الجهود المؤسسية والرسمية لدعم ذلك كله. 
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ونحن نأمل -# ختام هذا الكتاب من باكورة إصدارات مركز الملك عبد اللّه 
بن عبد العزيز الدولي لخدمة اللغة العربية- أن يتبني هذا المركز الدولي وأمثاله 
المبادرات لتطوير حوسبة اللغة العربية ابتداء من مستوى البنى التحتية ومرورا 
بمستوى الأدوات ووصولا لمستوى التطبيقات. واللّه نسأل التوفيق لما يحبه ويرضاه. 
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فهرس الموضوعات 
لسنمة 
كلمة المركز 0 
مقدمة ١‏ 


حول نظام تمثيل الحرف العربي 


0 4 
أبحاث جامعة ليدز ل مجال لسانيات المدونات العربية 5 
5 3 6 

د. إيريك أتويل (5655611 85116 ) / أ. عبد الله بن يحيى الفيفى 

قواعد البيانات الالكترونية للمخطوطات التراثية العربية والاسلامية : الحاضر والمستقبل 5 
. 0 

35 سامح عويضة 

استقصاء تقنيات معالجة اللغات الطبيعية وتطبيقاتها ك2 اللغة العربية 5 

د. أمجد أبو جبارة 

استخدام القواعد الاستنباطية 2 تحسين أداء التشكيل الآلي 0 

الترجمة الآلية من العربية وإليها 5 

أ.د. محمد زكي خضر 

تقنيات التعرف الآلي على الكلام المنطوق وتطبيقاتها ب القرآن الكريم: واقع وطموح 5 

د.يحيى محمد الحاج 

الخائمة 3 

الفهرس رذ 


ردي 


